Kỹ thuật lập mô hình trong Phân tích kinh doanh với R



Blog giới thiệu ngắn gọn về Kỹ thuật lập mô hình trong Phân tích kinh doanh với R.

Các kỹ thuật tạo mô hình khác nhau:

Chúng tôi có thể chia bất kỳ vấn đề nào thành các quy trình nhỏ hơn:





Phân loại - là nơi chúng tôi phân loại dữ liệu. Ví dụ. tất cả các bệnh đều biểu hiện một số hành vi nhất định, và chúng ta có thể phân loại thêm.

Ví dụ: bệnh giảm khả năng miễn dịch, bệnh gây đau đầu, v.v.



hồi quy - liên quan đến việc tìm ra mối quan hệ giữa nhiều biến.

Ví dụ: cân nặng của một con người có liên quan như thế nào đến chiều cao của anh ta.

AnomolyPhát hiện - về cơ bản là một sự biến động.



Ví dụ: Trong trường hợp điện áp cao hoặc điện áp thấp.

Một ví dụ khác có thể bao gồm hành vi được điều chỉnh liên quan đến việc lái xe ở phía bên phải hoặc bên trái tùy theo quốc gia. Anomoly ở đây là một người nào đó đang lái xe từ phía đối diện.

Một ví dụ khác có thể là xâm nhập mạng. Tại đây, một người dùng đã được xác thực đăng nhập vào trang web của công ty bạn và sau đó nếu ai đó chưa được xác thực đăng nhập, thì đó làAn0moly.

Tầm quan trọng của thuộc tính - Về cơ bản, nó cung cấp nhiều thuộc tính, chẳng hạn như chiều cao, cân nặng, nhiệt độ, nhịp tim. Một điểm cần lưu ý là tất cả các thuộc tính này đều quan trọng đối với một nhiệm vụ.

Ví dụ: Ai đó đang cố gắng dự đoán, một người sẽ lên chức vào thời gian nào. Mỗi thuộc tính đều có vai trò quan trọng nhưng không phải thuộc tính nào cũng quan trọng.

Quy tắc kết hợp - Nói một cách đơn giản hơn, đó là phân tích hoặc dự đoán các hành vi tiếp theo, nơi nó xoay quanh công cụ khuyến nghị.

lớp ẩn danh trong java là gì

Ví dụ: Một người mua bánh mì cũng có thể mua sữa. Nếu chúng ta phân tích các hành vi mua sắm trong quá khứ, tất cả các mặt hàng trong giỏ đều có mối quan hệ với nhau. Trong trường hợp này, có thể có xác suất người mua bánh mì cũng sẽ mua sữa.

Phân cụm - Đây là một trong những kỹ thuật lâu đời nhất trong thống kê. Trên thực tế, người ta luôn có thể mô hình hóa bất kỳ vấn đề nào, có thể là phân loại hoặc phân cụm, nghĩa là nhóm các thực thể giống nhau.

Ví dụ:

1) Lấy một rổ táo và cam, trong đó chúng ta có thể tách táo với cam.

2) Một trường hợp sử dụng quan trọng để phân cụm là chăm sóc sức khỏe. Hầu hết tất cả các thống kê và phân tích đều bắt đầu với các trường hợp sử dụng trong chăm sóc sức khỏe. Để đi sâu hơn, có một thuật ngữ phân cụm được gọi là nhóm thuần tập (những người mắc bệnh tương tự), để họ có thể được nghiên cứu tách biệt với khách hàng hiện tại. Ví dụ, nếu 10 người đang bị sốt và 10 người khác bị đau đầu, chúng ta sẽ tìm điểm chung giữa họ và tạo ra thuốc.

Khai thác tính năng - Trong tính chính xác khai thác tính năng, tính hợp lệ và thất bại là khá liên quan. Nói cách khác, trích xuất đặc điểm có thể được gọi là nhận dạng mẫu.

Ví dụ:

Trong tìm kiếm của Google, khi người dùng nhập một cụm từ, nó sẽ xuất hiện kết quả. Bây giờ, một câu hỏi quan trọng cần được đặt ra là làm sao nó biết được, trang nào có liên quan và không liên quan đến thuật ngữ? Điều này có thể được giải đáp bằng tính năng trích xuất tính năng và nhận dạng mẫu, nơi nó thêm các tính năng nổi bật. Giả sử một bức ảnh được đưa ra, một số máy ảnh nhất định phát hiện khuôn mặt, đánh dấu khuôn mặt để cho hình ảnh đẹp, cũng sử dụng tính năng nhận dạng.

iso 9000 so với sáu sigma

Học tập có giám sát và học tập không được giám sát

đến) Danh mục dự đoán - Các kỹ thuật bao gồm hồi quy, logistic, mạng nơ ron và cây quyết định. Một số ví dụ bao gồm phát hiện gian lận (trong đó máy tính học và dự đoán gian lận tiếp theo từ lịch sử gian lận trước đó). Trong học tập không có giám sát, người ta không thể dự đoán bằng các ví dụ vì không có dữ liệu lịch sử.

b) Phân loại loại - Lấy một ví dụ, cho dù giao dịch có gian lận hay không, nó được đưa vào danh mục phân loại. Tại đây, chúng tôi lấy dữ liệu lịch sử và phân loại nó bằng cây quyết định hoặc trong trường hợp chúng tôi hoàn toàn không lấy bất kỳ dữ liệu lịch sử nào, thì chúng tôi bắt đầu trực tiếp trên dữ liệu và cố gắng khai thác các tính năng của riêng mình. Ví dụ, nếu chúng ta cần biết các nhân viên, những người có khả năng rời tổ chức hoặc có khả năng ở lại. Trong trường hợp đó là một tổ chức mới, nơi chúng tôi không thể sử dụng dữ liệu lịch sử, chúng tôi luôn có thể sử dụng phân nhóm để trích xuất dữ liệu.

c) Hạng mục Khám phá - Đây là một phương pháp thẳng tiến, sắp tới, dữ liệu lớn có nghĩa là gì. Trong học tập không giám sát, nó được gọi là các thành phần nguyên tắc và phân cụm.

d) Danh mục sở thích - ở đây có nhiều yếu tố liên quan như bán chéo / bán tăng, phân tích rổ thị trường. Trong phân tích rổ, không có học tập có giám sát vì không có dữ liệu lịch sử. Vì vậy, chúng tôi lấy dữ liệu trực tiếp và tìm các liên kết, sắp xếp trình tự và phân tích nhân tố.

Có một câu hỏi cho chúng tôi? Đề cập đến họ trong phần bình luận và chúng tôi sẽ liên hệ lại với bạn.

Bài viết liên quan: