Phân Tích Dự Đoán ( Predictive Analytics Là Gì Và Vì Sao Lại Quan Trọng?

Phân tích dự báo hay còn gọi Predictive analytics là một trong những phương pháp, kỹ thuật phân tích dữ liệu phổ biến và quan trọng nhất ngày nay. Đây là công cụ hữu ích để những nhà khoa học, chuyên gia hoạt động ở lĩnh vực Data science có cái nhìn chi tiết về đối tượng nghiên cứu, khám phá các mối liên hệ, đưa ra những phán đoán về đối tượng nghiên cứu ở tương lai chứ không chỉ dừng lại tại quá trình mô tả. Chính vì các ưu điểm mà Predictive analytics đem lại, nó được triển khai rộng rãi bởi hầu hết mọi tổ chức, công ty thuộc nhiều ngành, lĩnh vực khác nhau.

Bạn đang xem: Phân Tích Dự Đoán ( Predictive Analytics Là Gì Và Vì Sao Lại Quan Trọng?

*

Trong chủ đề: “Tổng quan về Predictive analytics”, ở phần 1 bài viết lần này 90namdangbothanhhoa.vn sẽ giới thiệu đến các bạn khái niệm về phân tích dự báo, phân biệt giữa Predictive analytics với một số thuật ngữ như Data analytics (phân tích dữ liệu), Descriptive analytics (phân tích mô tả), Prescriptive analytics (phân tích đề xuất) và sau cùng là những lợi ích, ứng dụng của nó. Còn phần 2, chúng tôi sẽ tập trung trình bày về quy trình các bước, và những thuật toán có trong Predictive analytics.

Mặc dù Predictive analytics đã ra đời từ lâu nhưng trong những năm gần đây mới được quan tâm nhiều hơn và được coi là một quy trình không thể thiếu trong các hoạt động khai thác dữ liệu ở mỗi tổ chức. Nguyên nhân là do sự phát triển của khoa học, công nghệ ví dụ như lĩnh vực Big Data, xu hướng ứng dụng Machine learning, v.v, các công ty có động lực thúc đẩy, và tiếp cận gần hơn với Predictive analytics thông qua những công cụ, phần mềm tiên tiến.

Nếu các bạn nào có theo dõi từng bài viết của 90namdangbothanhhoa.vn, thì chắc đã nắm rõ “lợi ích của dữ liệu hay phân tích dữ liệu là gì?”, tầm quan trọng của định hướng dữ liệu, tại sao dữ liệu là nguồn sống của mỗi công ty trong thời đại 4.0 và sự cần thiết khi phải tận dụng chúng hiệu quả.

Ngày nay, nhiều tổ chức phải đối mặt với các thách thức khi giải quyết khối lượng dữ liệu khổng lồ, phức tạp, đa dạng về loại, và nguồn thu thập nhưng chứa đựng rất nhiều thông tin hữu ích để nghiên cứu hành vi khách hàng, xu hướng bán hàng, đánh giá thị trường và nhiều yếu tố khác nhằm hỗ trợ cho việc đề xuất các chiến lược hoạt động, chiến lược kinh doanh, cạnh tranh trong ngắn hạn, dài hạn trở nên hợp lý, hiệu quả và tạo thêm doanh thu. Predictive analytics chính là chìa khóa sẽ giúp các công ty tìm hiểu những thông tin ấy, đạt được giá trị mong muốn từ dữ liệu và mục tiêu của mình.

Khái niệm về Predictive analytics

Theo SAS – công ty đi đầu về lĩnh vực phân tích dữ liệu trụ sở tại Hoa Kỳ, và các chi nhánh trên toàn cầu, cung cấp dịch vụ tư vấn về dữ liệu, phần mềm phân tích dữ liệu cao cấp: “Phân tích dự báo là việc sử dụng dữ liệu kết hợp với các thuật toán thống kê, kỹ thuật trong “Machine learning” để xác định những khả năng, kết quả có thể xảy ra của đối tượng nghiên cứu trong tương lai dựa trên dữ liệu lịch sử. Mục tiêu của phân tích dự báo là vượt lên trên các hiểu biết về những gì đã xảy ra ở quá khứ để đánh giá tốt nhất những gì sẽ xảy ra trong tương lai.”.

Nhờ các phần mềm, công cụ phân tích dữ liệu hiện tại cung cấp những giao diện, tính năng tương tác, sử dụng dễ dàng hơn dành cho người dùng không cần phải có đầy đủ kiến thức, kỹ năng chuyên sâu về Data science. Do đó không chỉ những chuyên gia thống kê, chuyên gia phân tích mới tham gia vào quy trình triển khai Predictive analytics mà còn có những nhà quản lý cấp cao, các giám đốc kinh doanh, chuyên gia kinh tế, thậm chí là những nhân viên ở các bộ phận chức năng khác… cũng có thể tự mình phân tích dữ liệu để đưa ra các dự báo hỗ trợ xây dựng chiến lược hiệu quả cho công ty.

Chúng ta cùng đi đến một số khái niệm khác như:

Theo Wikipedia (English): “Phân tích dự báo quy trình sử dụng bao gồm nhiều kỹ thuật thống kê, thuật toán từ Data minig, Machine learning, v.v. để phân tích các sự kiện hiện tại và lịch sử để đưa ra dự đoán về các sự kiện trong tương lai hoặc chưa biết. Phân tích dự báo còn là một lĩnh vực thống kê liên quan đến việc trích xuất thông tin từ dữ liệu và sử dụng nó để dự đoán các mô hình xu hướng và hành vi, cốt lõi dựa vào việc nắm bắt mối quan hệ giữa các biến giải thích và các biến dự đoán (ở mô hình hồi quy) từ các lần xuất hiện trong quá khứ và khai thác chúng để dự báo kết quả chưa biết.”

Theo MathWorks – công ty chuyên cung cấp các phần mềm tin học tính toán ví dụ nổi tiếng như MATLAB: “Phân tích dự báo sử dụng dữ liệu cùng với kỹ thuật phân tích, thống kê và học máy để tạo ra một mô hình dự báo để dự báo các sự kiện trong tương lai. Thông thường, dữ liệu lịch sử được sử dụng để xây dựng một mô hình toán học để nắm bắt các xu hướng quan trọng. Mô hình dự báo đó sau đó được sử dụng trên dữ liệu hiện tại để dự báo điều gì sẽ xảy ra tiếp theo hoặc để đề xuất các hành động cần thực hiện để đạt được kết quả tối ưu.”

Qua các khái niệm được trình bày ở trên chắc các bạn phần nào cũng đã hiểu được khái quát về Predictive analytics. Để hình dung rõ hơn chúng ta có thể lấy ví dụ như một công ty nào đó muốn biết lợi nhuận của họ sẽ như thế nào vào những năm tiếp theo, họ đang có những dữ liệu, thông tin như các xu hướng bán hàng, doanh số hiện tại, dữ liệu khách hàng bao gồm lịch sử giao dịch, giá trị khách hàng mang lại cho công ty,…tiếp theo họ sẽ sử dụng các kỹ thuật, phương pháp như thống kê (Statistics), Data mining để mô tả các biến dữ liệu, tìm hiểu những mối liên hệ giữa những yếu tố có thể tác động đến lợi nhuận, dự báo lợi nhuận có thể thay đổi ra sao trong tương lai. Về cách thức vận hành quy trình cùng với các thuật toán có trong phân tích dự báo chúng tôi sẽ trình bày ở phần 2.

Để hiểu rõ hơn về phân tích dự báo chúng ta cùng sang phần tiếp theo, phân biệt Predictive analytics với Data analytics, Descriptive và Prescriptive analytics

*

Nguồn hình: tech.economictimes.indiatimes.com

Phân biệt Predictive analytics với Data analytics, Descriptive và Prescriptive analytics

Những thông tin chúng tôi trình bày dưới đây được tham khảo từ các tài liệu hướng dẫn của các website thuộc nhiều tổ chức khác nhau đặc biệt là EDUCBA – tổ chức giáo dục hàng đầu cung cấp các khóa học đào tạo kiến thức, kỹ năng trực tuyến trong lĩnh vực Data science, và một số lĩnh vực khác.

Đầu tiên chúng ta phải tìm hiểu qua định nghĩa của Analytics: là một quy trình khoa học khám phá thông tin có giá trị từ dữ liệu để đưa ra quyết định, giải quyết vấn đề tốt hơn, dựa vào ứng dụng thống kê, toán học, khoa học máy tính (lập trình), và các phương pháp nghiên cứu khác. Analytics được hiểu là một quá trình biến đổi dữ liệu thành hành động thông qua kết quả phân tích và những hiểu biết sâu sắc có được từ dữ liệu. Analytics có 3 dạng chính: Descriptive analytics (phân tích mô tả), Predictive analytics, và Prescriptive analytics (phân tích đề xuất).

Predictive analytics vs Data analytics

Xem thêm: tự long thi ai là triệu phú

1. Data analytics là một dạng chung, hình thức tổng quát của Analytics liên quan đến việc nghiên cứu, xử lý các bộ dữ liệu để đưa ra kết luận về những thông tin mà các bộ dữ liệu đó có, và được sử dụng trong kinh doanh để hỗ trợ ra quyết định trên dữ liệu. Còn Predictive analytics là một dạng đặc biệt của Analytics (bên cạnh Descriptive và Prescriptive analytics), phân tích kỹ lưỡng dữ liệu lịch sử, phát hiện các mối quan hệ trong dữ liệu, sử dụng kết quả phân tích, thông tin có được để đưa ra dự báo trong tương lai.

2. Data analytics sử dụng các công cụ, kỹ thuật để giúp các nhà kinh doanh ra quyết định hợp lý hơn trong thời gian thực, còn Predictive analytics thì nghiêng về dự báo để hỗ trợ ra quyết định trong tương lai.

3. Các nhà khoa học và nhà nghiên cứu dữ liệu sử dụng Data Analytics xác minh hoặc bác bỏ các mô hình, lý thuyết và giả thuyết khoa học. Trong khi Predictive analytics sử dụng nhiều công cụ và phần mềm chuyên dụng, giúp các nhà khoa học và nhà nghiên cứu dữ liệu dự báo các kết quả có thể xảy ra với niềm tin thành công cao hơn.

4. Data analytics khai thác dữ liệu thô để tìm ra những thông tin hữu ích, đưa ra kết luận sau cùng, giúp công ty đạt được mục tiêu đề ra ban đầu. Data analytics sử dụng các phương pháp, kỹ thuật phân tích “truyền thống” như lý thuyết thống kê, công thức toán học đã ra đời từ lâu để tìm ra các thông tin ẩn chứa bên trong dữ liệu ví dụ sở thích của khách hàng, xu hướng thị trường và thông tin hữu ích khác có thể giúp đưa ra quyết định sáng suốt hơn cho doanh nghiệp. Trong khi đó, Predictive analytics sử dụng các mô hình tính toán và thuật toán tiên tiến để xây dựng một nền tảng dự báo một cách thông minh, ví dụ, một nhà kinh doanh có thể muốn dự đoán các biến động về giá hàng hóa, phát hiện rủi ro đầu tư trong tương lai gần (hoặc trong thời gian ngắn)

5. Đối với những người thực hiện Data analytics, họ phải nắm rõ và chuyên sâu kiến thức về toán, thống kê đôi khi không cần phải quá am hiểu ở lĩnh vực công nghệ kỹ thuật và các công cụ sử dụng. Trong khi những người thực hiện Predictive analytics thì hầu hết yêu cầu phải có cả kiến thức về thống kê và công nghệ kỹ thuật, kỹ năng sử dụng các công cụ, phần mềm khác nhau hỗ trợ phân tích.

6. Nhiều tổ chức thu thập, lưu trữ, dữ liệu liên quan đến khách hàng, đối tác kinh doanh, đối thủ cạnh tranh, v.v. Data Analytics sau đó được sử dụng để phân tích, nghiên cứu các mối liên hệ, xu hướng trong dữ liệu. Còn Predictive analytics tạo điều kiện cho việc ra quyết định trong tương lai.

7. Quy trình Data analytics có bao gồm xử lý dữ liệu thô, để có được dữ liệu chất lượng tốt để đưa vào phân tích, còn với Predictive analytics thì dữ liệu “sạch” luôn được cung cấp.

8. Kết quả của Data analytics có thể được sử dụng để dự báo hoặc không tùy vào yêu cầu, trường hợp kinh doanh. Predictive analytics cho phép tuyên bố các giả định, giả thuyết và kiểm tra chúng bằng các mô hình thống kê sau thiết lập mô hình dự báo.

9. Quy trình Data analytics có thể bao gồm các bước sau: thu thập, kiểm tra dữ liệu, làm sạch, chuyển đổi dữ liệu, phân tích để đi đến kết luận. Còn quy trình Predictive analytics bao gồm xác định mục tiêu, thu thập dữ liệu, thực hiện phân tích, thống kê, xây dựng mô hình dự báo, triển khai mô hình và giám sát mô hình (chi tiết chúng tôi sẽ trình bày ở phần 2 bài viết sau).

Predictive analytics vs Descriptive analytics

Predictive analytics sẽ cung cấp các thông tin về những gì chưa xảy ra hay nói cách khác giúp một tổ chức biết điều gì có thể diễn ra tiếp theo, dự báo tương lai dựa trên phân tích dữ liệu lịch sử. Predictive analytics đưa ra các kết quả dự báo mà tổ chức muốn biết, và tính toán các xác suất xảy ra tương ứng.

Ngược lại, Descriptive analytics (phân tích mô tả) sẽ giúp một tổ chức biết được những gì đã xảy ra trong quá khứ (nguyên nhân và hệ quả), hay đưa ra các phân tích về những sự kiện trong quá khứ bằng cách sử dụng dữ liệu đã được lưu trữ trước đó kết hợp với phương pháp phân tích thích hợp.

Descriptive analytics cũng cực kỳ quan trọng đối với một công ty bên cạnh công cụ Predictive analytics. Nó giống như một bảng báo cáo chi tiết về tình hình hoạt động trước đây của công ty, những gì công ty làm tốt hay chưa tốt, những yếu tố nào đã ảnh hưởng đến mục tiêu kinh doanh hay lợi nhuận của công ty và ảnh hưởng như thế nào, v.v. Descriptive analytics hỗ trợ rất nhiều, góp phần vào tỷ lệ thành công của các chiến lược, quyết định dựa trên Predictive analytics.

Ví dụ một công ty dự kiến sẽ ra mắt một chương trình khuyến mãi đặc biệt dành cho khách hàng trong dịp lễ sắp tới ở năm nay, tương tự như hồi năm ngoái. Công ty này sử dụng Descriptive analytics để xem xem năm ngoái, cũng vào thời điểm dịp lễ đó, khi thực hiện chương trình khuyến mãi, thì doanh số biến động như thế nào, nếu doanh số tăng cao thì nguyên nhân nào khiến nó tăng và ngược lại. Tiếp theo công ty có thể sử dụng Predictive analytics phân tích dữ liệu lịch sử để đưa ra dự báo về giá cả thị trường, nhu cầu khách hàng sắp tới, v.v. Kết hợp cả thông tin có được từ phân tích mô tả, và phân tích dự báo, công ty sẽ có được một chương trình khuyến mãi tối ưu hơn.

Các điểm khác biệt giữa Descriptive analytics và Predictive analytics:

Descriptive analytics sẽ cung cấp cho công ty một tầm nhìn tổng quan về quá khứ, cho công ty biết: chuyện gì đã xảy ra? Trong khi đó, Predictive analytics giúp công ty có cái nhìn về tương lai, cho công ty biết: điều gì có thể xảy ra trong tương lai? Phân tích mô tả được sử dụng khi công ty cần phân tích và giải thích các khía cạnh khác nhau trong tổ chức của mình, còn phân tích dự báo được sử dụng khi công ty cần biết bất cứ điều gì về tương lai, lấp đầy những thông tin mà công ty chưa biết.Trong lĩnh vực kinh doanh, phân tích mô tả sẽ giúp một tổ chức biết vị trí hiện tại của họ trên thị trường thông qua các số liệu, tình hình thực tế. Trong khi đó các phân tích dự báo sẽ giúp một tổ chức biết họ sẽ đứng trên thị trường như thế nào trong tương lai thông qua dự báo các số liệu, sự kiện sẽ xảy ra.Các báo cáo, thông tin có được thông qua phân tích mô tả là chính xác nhưng các báo cáo, thông tin có được thông qua phân tích dự báo không chính xác 100%, nó có thể xảy ra hoặc không thể xảy ra trong tương lai.Ví dụ về Descriptive analytics: các báo cáo về kết quả hoạt động, về doanh thu của công ty. Còn ví dụ Predictive analytics: báo cáo phân tích về khả năng rời dịch vụ của khách hàng, phân tích rủi ro tín dụng thông qua Credit score của khách hàng,…Descriptive analytics được xem là cách tiếp cận thụ động, nghĩa là công ty chỉ phân tích để tìm hiểu những gì đã xảy ra chứ không thể kiểm soát chúng. Còn Predictive analytics là cách tiếp cận chủ động, ví dụ nếu công ty có thể dự báo được rủi ro khách hàng rời dịch vụ thì sẽ đề xuất được giải pháp phù hợp giữ chân khách hàng, chứ một khi khách hàng đã rời dịch vụ thì mới bắt đầu phân tích nguyên nhân công ty dĩ nhiên chịu tổn thất cao hơn.

Predictive analytics vs Prescriptive analytics

Ở phần này chúng tôi sẽ không phân tích các điểm khác biệt bằng cách so sánh song song giữa 2 thuật ngữ, chỉ sẽ trình bày tổng quan về Prescriptive analytics mà thôi, để tránh làm dài bài viết, với nguyên nhân do các đặc điểm, định nghĩa về Predictive analytics chúng tôi đã trình bày rõ ở các phần trên.

Xem thêm: cô dâu bùi thị xuân hồng là ai

Nếu Descriptive analytics sử dụng Data aggregation và Data mining để cung cấp cái nhìn sâu sắc về quá khứ và trả lời cho câu hỏi “chuyện gì đã xảy ra?”, “Predictive analytics sử dụng các mô hình thống kê và kỹ thuật dự báo để có cái nhìn về tương lai và trả lời cho câu hỏi: “điều gì có thể xảy ra?”. Thì Prescriptive analytics sẽ sử dụng các thuật toán tối ưu hóa và ứng dụng mô phỏng để đưa ra các tư vấn, các khuyến nghị giúp công ty đề xuất các quyết định, hành động khả thi (có thể dựa trên kết quả phân tích có được từ Descriptive và Prescriptive analytics), trả lời cho câu hỏi: “vậy chúng ta nên làm gì?”