Học tập có giám sát trong Apache Mahout



Học có giám sát là một kỹ thuật học máy, trong đó một chức năng được suy ra từ các ví dụ được gắn nhãn của dữ liệu đào tạo.

Học có Giám sát là phương pháp, trong đó dữ liệu đào tạo bao gồm cả đầu vào và kết quả mong muốn. Đào tạo hệ thống với các ví dụ được gọi là học có giám sát. Hoặc nếu không, việc đào tạo thuật toán với một giáo viên cũng có thể được coi là học có giám sát. Sau khi huấn luyện thuật toán với tất cả dữ liệu mẫu hoặc dữ liệu được gắn nhãn, có cả yếu tố dự đoán trên biến mục tiêu, người ta có thể huấn luyện thuật toán và sử dụng ví dụ chưa thấy để phân loại thêm.





Dưới đây là một số tính năng quan trọng của Học có giám sát trong Mahout:

  • Việc xây dựng một bộ đào tạo, xác nhận và kiểm tra thích hợp (Bok) là rất quan trọng.
  • Các phương pháp này thường nhanh chóng và chính xác.
  • Các phương pháp Học tập có Giám sát phải có khả năng tổng quát hóa.
  • Chúng cho kết quả chính xác, khi dữ liệu mới được đưa vào đầu vào mà không biếttiên nghiệmMục tiêu.
  • Trong một số trường hợp, các kết quả (mục tiêu) chính xác được biết đến và được cung cấp đầu vào cho mô hình trong quá trình học.

Ví dụ về học tập có giám sát

Trong trường hợp, bạn muốn huấn luyện một nhiệm vụ và bạn được cung cấp hai nhóm hình ảnh khác nhau cùng với dữ liệu được gắn nhãn, ví dụ: trong hình trên, một nhóm có hình ảnh con voi và nhóm kia có hình ảnh sư tử. Dữ liệu được gắn nhãn ngụ ý mỗi tập dữ liệu có một giá trị đích. Trong ví dụ trên, tập dữ liệu là hình ảnh của con voi, trong khi nhãn được cấp cho nó, tức là “Con voi” là giá trị đích của tập dữ liệu. Tập dữ liệu có nhãn như vậy được sử dụng cho quá trình huấn luyện, để thuật toán huấn luyện có thể tận dụng tập dữ liệu này và xây dựng một số mô hình, có thể được sử dụng thêm để phân loại các ví dụ không nhìn thấy mà không có dữ liệu được gắn nhãn hoặc biến mục tiêu.



Hãy xác định các đặc điểm giúp xác định một đối tượng là voi hay sư tử:

làm thế nào để chuyển đổi từ double sang int java

Các tính năng có thể là - kích thước, màu sắc, chiều cao, kích thước tai, thân cây, ngà

Đây có thể được gọi là một tập hợp tính năng, sẽ được sử dụng cho mục đích đào tạo. Bộ tính năng này sẽ tác động đến biến mục tiêu cuối cùng. Các biến này được gọi là biến dự báo , bởi vì chúng giúp chúng tôi xác định biến mục tiêu cuối cùng . Biến cuối cùng cũng có thể được gọi là nhãn. Biến cuối cùng đây là Voi / Sư tử.



table-word

Trong ví dụ này, mỗi bản ghi trong danh mục, kích thước, màu sắc, chiều cao, kích thước tai, thân và ngà là một biến dự đoán, trong khi Voi và Sư tử là các biến mục tiêu. Các biến này có thể được coi là các ví dụ đào tạo và tập dữ liệu đào tạo tương ứng.

Do đó, Học có giám sát là một cách, qua đó bạn đào tạo cùng với các nhãn, trong đó bạn yêu cầu thuật toán trích xuất một số tính năng nhất định ra khỏi nó và dựa trên đó, bất cứ khi nào bạn nhìn thấy một ví dụ không nhìn thấy, thuật toán sẽ có thể phân loại nó vào đúng lớp.

Có một câu hỏi cho chúng tôi? Đề cập đến họ trong phần bình luận và chúng tôi sẽ liên hệ lại với bạn.

phân tích cú pháp tệp xml trong java

Bài viết liên quan: