Phân tích dữ liệu doanh nghiệp là công việc khai thác dữ liệu (data) bên trong và bên ngoài doanh nghiệp, đưa ra những thông tin (information) cần thiết từ đó hỗ trợ quá trình ra quyết định dựa trên dữ liệu (Data-driven decision making), giúp gia tăng hiệu quả hoạt động doanh nghiệp.
Có nhiều loại hình phân tích dữ liệu.
Descriptive Analytics – Phân tích Mô tả. Trả lời câu hỏi: CÁI GÌ ĐÃ XẢY RA?
Phân tích mô tả thu thập dữ liệu thô từ nhiều nguồn dữ liệu để cung cấp chi tiết những thông tin trong quá khứ. Những thông tin này cho biết có điều gì đó đang diễn ra là bất thường hay bình thường, có điều gì đó cần lưu ý, có điều gì đó đang cảnh báo cần phải hành động, …
Diagnostic Analytics – Phân tích Chẩn đoán. Trả lời câu hỏi: VÌ SAO CÁI ĐÓ ĐÃ XẢY RA?
Phân tích chẩn đoán sử dụng những kết quả của phân tích mô tả để tìm ra nguyên nhân của các sự kiện. Phân tích chẩn đoán bao gồm:
Xác định những điểm bất thường cần chẩn đoán nguyên nhân.
Thu thập dữ liệu liên quan đến những điểm bất thường này,
Sử dụng các kỹ thuật phân tích chẩn đoán để chỉ ra nguyên nhân gián tiếp và trực tiếp của sự kiện.
Predictive Analytics – Phân tích Dự đoán. Trả lời câu hỏi: CÁI GÌ SẼ XẢY RA?
Phân tích dự đoán sử dụng các dữ liệu trong quá khứ để xác định các xu hướng và khả năng xảy ra xu hướng đó trong tương lại. Độ chính xác của các dự đoán phụ thuộc vào chất lượng dữ liệu và tính ổn định của bối cảnh nghiệp vụ. Phân tích dự đoán cần áp dụng các kỹ thuật thống kê và các thuật toán máy học.
Prescriptive Analytics – Phân tích Đề xuất. Trả lời câu hỏi: SAU ĐÂY NÊN LÀM GÌ?
Phân tích đề xuất yêu cầu độ lớn nhất định của bộ dữ liệu đưa vào phân tích, bao gồm dữ liệu bên trong và bên ngoài doanh nghiệp. Bộ dữ liệu càng phong phú, kết quả của phân tích đề xuất càng có giá trị. Cũng như phân tích dự đoán, phân tích đề xuất cần phải sử dụng các kỹ thuật thống kê và các thuật toán máy học.
Cognitive Analytics – Phân tích Nhận thức. Trả lời cả 4 CÂU HỎI TRÊN theo các vòng lặp tự động.
Phân tích nhận thức chính là quá trình máy học. Thuật toán máy học diễn giải từ các dữ liệu và các mẫu đã có, đưa ra các kết luận dựa trên kiến thức hiện tại, sau đó thêm những kết quả này vào vốn kiến thức để tiếp tục đưa ra các diễn giải về tương lai, tạo ra một vòng lặp tự học hỏi. Các diễn giải không phải là những truy vấn có cấu trúc trên những dữ liệu quy chuẩn, thay vào đó, là những dự đoán không có cấu trúc được thu thập từ nhiều nguồn với độ tin cậy thay đổi. Hiệu quả của phân tích nhận thức hoàn toàn phụ thuộc vào các thuật toán học máy, và sẽ sử dụng các concept về xử lý ngôn ngữ tự nhiên để phân tích các nguồn dữ liệu chưa được dùng tới, ví dụ như nhật ký cuộc gọi bán hàng hay review sản phẩm.