Quy trình phân tích dự đoán trong Phân tích kinh doanh với R



Blog cung cấp một ý tưởng ngắn gọn về quy trình Phân tích dự đoán trong Phân tích kinh doanh với R

Quy trình mô hình hóa điển hình:

Trong một quá trình mô hình hóa điển hình, điều quan trọng là bắt đầu vẽ một giả thuyết. Một RFP (Yêu cầu Đề xuất) được nhận và sau đó một Giả thuyết được rút ra.





  1. Xác định nguồn dữ liệu phù hợp - Tại đây, khách hàng có thể cung cấp nguồn dữ liệu, nếu không có, chúng tôi phải tìm nguồn dữ liệu. Đưa ra một kịch bản, trong đó chúng tôi cố gắng đánh giá ai sẽ thắng cuộc bầu cử, một phân tích dữ liệu công khai được thực hiện với các nguồn bao gồm phương tiện truyền thông xã hội, kênh tin tức hoặc dư luận. Chúng ta cũng cần hiểu lượng dữ liệu cần thiết để phân tích vấn đề. Trong trường hợp này, chúng tôi thường tìm kiếm các mẫu lớn, vì đó là trường hợp Bầu cử. Mặt khác, nếu phân tích được thực hiện trên Healthcare, rất khó để thực hiện cho một số lượng lớn dân số vì có khả năng không có đủ người để xác thực giả thuyết. Ngoài ra, chất lượng của dữ liệu cũng rất quan trọng.
  2. Trích xuất dữ liệu - Ví dụ: nếu chúng tôi lấy mẫu dân số, chúng tôi có thể xem xét các thuộc tính, chẳng hạn như thu nhập cao, thu nhập thấp, độ tuổi, dân số lao động (ngoại vi / tại chỗ), cư dân, NRI, phạm vi bệnh viện, v.v. để bắt đầu nghiên cứu . Ở đây, chúng ta có thể không cần quá nhiều thuộc tính cho giả thuyết. Chúng tôi hiểu rằng các thuộc tính, chẳng hạn như thu nhập cao và thấp có thể không phải là yếu tố góp phần xác định ai sẽ thắng cử. Nhưng tuổi tác có thể tạo ra sự khác biệt vì nó sẽ cho biết trực tiếp số người sẽ bỏ phiếu. Đôi khi, chúng tôi có thể loại trừ các thuộc tính ít được sử dụng hơn hoặc bao gồm các thuộc tính hữu ích. Nó có thể sai trong cả hai trường hợp. Đó là lý do tại sao phân tích là một thách thức.
  3. Xoa bóp Dữ liệu để vừa với Công cụ - Điều này là do không phải công cụ nào cũng có thể chấp nhận tất cả dữ liệu. Một số công cụ nhất định chỉ chấp nhận dữ liệu CSV hoặc dữ liệu excel. Thiếu công cụ là một thách thức.
  4. Chạy phân tích - Thao tác này có thể được thực hiện bằng nhiều kỹ thuật phân tích.
  5. Đi đến kết luận - Phân tích đưa ra những con số chính xác. Nhưng người dùng đưa ra kết luận từ những con số này. Ví dụ, nếu nó nói 10% hoặc 20%, chúng ta phải hiểu nó có nghĩa là gì? Nó có tạo ra mối tương quan giữa Thuộc tính A và Thuộc tính B không?
  6. Triển khai kết quả - Điều quan trọng là phải thực hiện các kết luận để thấy được kết quả trong kinh doanh. Ví dụ, có thể kết luận rằng 'Người ta mua ô trong mùa mưa' có thể dẫn đến kinh doanh nhiều hơn. Ở đây, chúng tôi cần thực hiện kết luận nơi chúng tôi sản xuất ô dù, có sẵn trong các cửa hàng, nhưng sau đó nó có thể gặp vấn đề về quản lý. Số liệu thống kê thời điểm cho kết quả, việc triển khai có thể bị sai.
  7. Theo dõi tiến độ - Bước cuối cùng ở đây, giám sát đóng một vai trò quan trọng. Việc giám sát có thể gặp trục trặc vì không có nhiều tổ chức muốn giám sát tiến độ và nó được coi là một bước không đáng kể. Nhưng việc giám sát là quan trọng vì chúng ta có thể hiểu được liệu nghiên cứu và kết luận của chúng ta có đang đi đúng hướng hay không.

Cũng xem bài viết này' Tương quan không có nghĩa là Nguyên nhân 'cung cấp cái nhìn sâu sắc về cách các nhà phân tích có thể sai lầm. Một điểm quan trọng cần lưu ý trong biểu đồ này là Chạy Phân tích là bước duy nhất mà máy móc phải chịu trách nhiệm và hơn thế nữa, con người cuối cùng sẽ xác định cách thức nghiên cứu được thực hiện.

Có một câu hỏi cho chúng tôi? Đề cập đến họ trong phần bình luận và chúng tôi sẽ liên hệ lại với bạn.



Bài viết liên quan: