Mạng thần kinh là gì? Giới thiệu về mạng thần kinh nhân tạo



Blog này về Mạng thần kinh là gì sẽ giới thiệu cho bạn các khái niệm cơ bản về Mạng thần kinh và cách chúng có thể giải quyết các vấn đề phức tạp theo hướng dữ liệu.

Với sự tiến bộ trong Học máy, đã đi một con đường cao. Deep Learning được coi là công nghệ tiên tiến nhất được xây dựng để giải quyết các vấn đề phức tạp sử dụng các tập dữ liệu khổng lồ. Blog này về Mạng thần kinh là gì sẽ giới thiệu cho bạn các khái niệm cơ bản về Mạng thần kinh và cách chúng có thể giải quyết các vấn đề phức tạp theo hướng dữ liệu.

Để có kiến ​​thức chuyên sâu về Trí tuệ nhân tạo và Học sâu, bạn có thể đăng ký trực tiếp của Edureka với hỗ trợ 24/7 và quyền truy cập trọn đời.





Đây là danh sách các chủ đề sẽ được đề cập trong Blog:

  1. Mạng thần kinh là gì?
  2. Học sâu là gì?
  3. Sự khác biệt giữa AI, ML và DL
  4. Cần học sâu
  5. Trường hợp sử dụng học sâu
  6. Mạng thần kinh hoạt động như thế nào?
  7. Ví dụ về mạng thần kinh

Định nghĩa đơn giản về mạng thần kinh

Được mô hình hóa phù hợp với bộ não con người, Mạng thần kinh được xây dựng để bắt chước chức năng của não người . Bộ não con người là một mạng lưới thần kinh được tạo thành từ nhiều tế bào thần kinh, tương tự như vậy, Mạng thần kinh nhân tạo (ANN) được tạo thành từ nhiều perceptron (sẽ giải thích sau).



Mạng thần kinh - Mạng thần kinh là gì - Edureka

Mạng nơron bao gồm ba lớp quan trọng:

  • Lớp đầu vào: Như tên cho thấy, lớp này chấp nhận tất cả các đầu vào do người lập trình cung cấp.
  • Lớp ẩn: Giữa lớp đầu vào và lớp đầu ra là một tập hợp các lớp được gọi là các lớp Ẩn. Trong lớp này, các phép tính được thực hiện dẫn đến kết quả đầu ra.
  • Lớp đầu ra: Các đầu vào trải qua một loạt các phép biến đổi thông qua lớp ẩn, cuối cùng dẫn đến kết quả đầu ra được phân phối qua lớp này lớp.

Trước khi chúng ta tìm hiểu sâu hơn về cách hoạt động của Mạng thần kinh, chúng ta hãy hiểu Học sâu là gì.



Học sâu là gì?

Học sâu là một lĩnh vực tiên tiến của Học máy sử dụng các khái niệm của Mạng thần kinh để giải quyết các trường hợp sử dụng có tính tính toán cao liên quan đến việc phân tích dữ liệu đa chiều. Nó tự động hóa quá trình khai thác tính năng, đảm bảo rằng cần sự can thiệp rất ít của con người.

Vậy Deep Learning chính xác là gì?

Học sâu là một nâng cao lĩnh vực phụ của Học máy sử dụng các thuật toán lấy cảm hứng từ cấu trúc và chức năng của não bộ được gọi là Mạng thần kinh nhân tạo.

Sự khác biệt giữa AI, ML và DL (Trí tuệ nhân tạo so với Học máy và Học sâu)

Mọi người thường có xu hướng nghĩ rằng , và Học kĩ càng giống nhau vì chúng có các ứng dụng chung. Ví dụ, Siri là một ứng dụng của AI, Máy học và Học sâu.

Vậy các công nghệ này có liên quan như thế nào?

  • Trí tuệ nhân tạo là khoa học về việc máy móc bắt chước hành vi của con người.
  • Máy học là một tập hợp con của Trí tuệ nhân tạo (AI) tập trung vào việc khiến máy móc đưa ra quyết định bằng cách cung cấp dữ liệu cho chúng.
  • Học kĩ càng là một tập hợp con của Học máy sử dụng khái niệm mạng nơ-ron để giải quyết các vấn đề phức tạp.

Tóm lại, AI, Machine Learning và Deep Learning là các lĩnh vực được kết nối với nhau. Học máy và Học sâu hỗ trợ Trí tuệ nhân tạo bằng cách cung cấp một tập hợp các thuật toán và mạng thần kinh để giải quyết vấn đề theo hướng dữ liệu.

Bây giờ bạn đã quen với các kiến ​​thức cơ bản, hãy hiểu điều gì đã dẫn đến nhu cầu Học sâu.

Cần học sâu: Hạn chế của các thuật toán và kỹ thuật học máy truyền thống

Máy học là một bước đột phá lớn trong thế giới kỹ thuật, nó dẫn đến việc tự động hóa các nhiệm vụ đơn điệu và tốn thời gian, giúp giải quyết các vấn đề phức tạp và đưa ra các quyết định thông minh hơn. Tuy nhiên, có một số hạn chế trong Học máy dẫn đến sự xuất hiện của Học sâu.

Dưới đây là một số hạn chế của Học máy:

  1. Không thể xử lý dữ liệu chiều cao: Học máy chỉ có thể xử lý các kích thước nhỏ của dữ liệu có chứa một nhóm nhỏ các biến. Nếu bạn muốn phân tích dữ liệu có chứa 100 biến, thì không thể sử dụng Học máy.
  2. Kỹ thuật tính năng là thủ công: Hãy xem xét một trường hợp sử dụng trong đó bạn có 100 biến dự báo và bạn chỉ cần thu hẹp những biến quan trọng. Để làm điều này, bạn phải nghiên cứu thủ công mối quan hệ giữa từng biến và tìm ra biến nào là quan trọng trong việc dự đoán kết quả đầu ra. Nhiệm vụ này cực kỳ tẻ nhạt và tốn thời gian đối với một nhà phát triển.
  3. Không lý tưởng để thực hiện phát hiện đối tượng và xử lý hình ảnh: Vì tính năng phát hiện đối tượng yêu cầu dữ liệu chiều cao, Máy học không thể được sử dụng để xử lý các tập dữ liệu hình ảnh, nó chỉ lý tưởng cho các tập dữ liệu có một số tính năng hạn chế.

Trước khi chúng ta đi sâu vào Mạng thần kinh, chúng ta hãy xem xét một trường hợp sử dụng trong thế giới thực, nơi Học sâu được triển khai.

Ứng dụng / Trường hợp sử dụng Deep Learning

Bạn có biết rằng PayPal xử lý hơn 235 tỷ đô la thanh toán từ bốn tỷ giao dịch của hơn 170 triệu khách hàng không? Nó sử dụng lượng lớn dữ liệu này để xác định các hoạt động gian lận có thể xảy ra trong số các lý do khác.

Với sự trợ giúp của các thuật toán Deep Learning, PayPal khai thác dữ liệu từ lịch sử mua hàng của khách hàng ngoài việc xem xét các dạng gian lận có thể xảy ra được lưu trữ trong cơ sở dữ liệu của nó để dự đoán liệu một giao dịch cụ thể có gian lận hay không.

Công ty đã dựa trên công nghệ Học máy & Học sâu trong khoảng 10 năm. Ban đầu, nhóm giám sát gian lận sử dụng các mô hình tuyến tính, đơn giản. Nhưng trong những năm qua, công ty đã chuyển sang một công nghệ Máy học tiên tiến hơn được gọi là Học sâu.

Nhà quản lý rủi ro gian lận và Nhà khoa học dữ liệu tại PayPal, Ke Wang, trích dẫn:

“Những gì chúng tôi thích thú từ việc học máy hiện đại, tiên tiến hơn là khả năng tiêu thụ nhiều dữ liệu hơn, xử lý các lớp và lớp trừu tượng và có thể 'nhìn thấy' những thứ mà một công nghệ đơn giản hơn không thể nhìn thấy, ngay cả con người cũng có thể không thể nhìn thấy. ”

Một mô hình tuyến tính đơn giản có khả năng sử dụng khoảng 20 biến. Tuy nhiên, với công nghệ Deep Learning, người ta có thể chạy hàng nghìn điểm dữ liệu. Do đó, bằng cách thực hiện Công nghệ Deep Learning, PayPal cuối cùng có thể phân tích hàng triệu giao dịch để xác định bất kỳ hành vi gian lận nào Hoạt động.

Bây giờ chúng ta hãy đi sâu vào Mạng lưới thần kinh và hiểu cách chúng hoạt động.

Mạng Neural hoạt động như thế nào?

Để hiểu mạng nơron, chúng ta cần chia nhỏ nó và hiểu đơn vị cơ bản nhất của Mạng thần kinh, tức là Perceptron.

Perceptron là gì?

Perceptron là một mạng nơ-ron một lớp được sử dụng để phân loại dữ liệu tuyến tính. Nó có 4 thành phần quan trọng:

  1. Đầu vào
  2. Trọng lượng và độ chệch
  3. Hàm tổng hợp
  4. Chức năng kích hoạt hoặc chuyển đổi

Logic cơ bản đằng sau một Perceptron như sau:

Các đầu vào (x) nhận được từ lớp đầu vào được nhân với trọng số w được ấn định của chúng. Sau đó, các giá trị nhân được thêm vào để tạo thành Tổng có Trọng số. Sau đó, tổng trọng số của các đầu vào và trọng số tương ứng của chúng được áp dụng cho một Chức năng Kích hoạt có liên quan. Chức năng kích hoạt ánh xạ đầu vào đến đầu ra tương ứng.

Trọng số và thiên vị trong học sâu

Tại sao chúng ta phải gán trọng số cho mỗi đầu vào?

Khi một biến đầu vào được đưa vào mạng, một giá trị được chọn ngẫu nhiên sẽ được gán làm trọng số của đầu vào đó. Trọng số của mỗi điểm dữ liệu đầu vào cho biết mức độ quan trọng của đầu vào đó trong việc dự đoán kết quả.

Mặt khác, tham số thiên vị cho phép bạn điều chỉnh đường cong chức năng kích hoạt sao cho đạt được đầu ra chính xác.

Hàm tổng hợp

Sau khi các đầu vào được ấn định một số trọng lượng, sản phẩm của đầu vào và trọng lượng tương ứng sẽ được lấy. Thêm tất cả các sản phẩm này cho chúng ta Tổng Trọng số. Điều này được thực hiện bởi hàm tổng kết.

Chức năng kích hoạt

Mục đích chính của các hàm kích hoạt là ánh xạ tổng có trọng số cho đầu ra. Các hàm kích hoạt như tanh, ReLU, sigmoid, v.v. là những ví dụ về các hàm chuyển đổi.

Để tìm hiểu thêm về các chức năng của Perceptron, bạn có thể xem qua phần này Blog.

Trước khi chúng tôi kết thúc blog này, hãy lấy một ví dụ đơn giản để hiểu cách Mạng thần kinh hoạt động.

Giải thích về mạng thần kinh bằng một ví dụ

Hãy xem xét một tình huống mà bạn sẽ xây dựng một Mạng thần kinh nhân tạo (ANN) phân loại hình ảnh thành hai lớp:

  • Loại A: Chứa hình ảnh của các lá không bị bệnh
  • Loại B: Chứa hình ảnh của các lá bị bệnh

Vì vậy, làm thế nào để bạn tạo ra một mạng lưới thần kinh phân loại lá cây bị bệnh và không bị bệnh?

Quá trình luôn bắt đầu với việc xử lý và biến đổi đầu vào theo cách có thể dễ dàng xử lý. Trong trường hợp của chúng tôi, mỗi hình ảnh chiếc lá sẽ được chia thành các pixel tùy thuộc vào kích thước của hình ảnh.

Ví dụ: nếu hình ảnh bao gồm 30 x 30 pixel, thì tổng số pixel sẽ là 900. Các pixel này được biểu diễn dưới dạng ma trận, sau đó được đưa vào lớp đầu vào của Mạng thần kinh.

Cũng giống như cách bộ não của chúng ta có các tế bào thần kinh giúp xây dựng và kết nối suy nghĩ, ANN có các perceptron tiếp nhận đầu vào và xử lý chúng bằng cách truyền chúng từ lớp đầu vào đến lớp ẩn và cuối cùng là lớp đầu ra.

Khi đầu vào được chuyển từ lớp đầu vào sang lớp ẩn, một trọng số ngẫu nhiên ban đầu được gán cho mỗi đầu vào. Các đầu vào sau đó được nhân với trọng số tương ứng của chúng và tổng của chúng được gửi dưới dạng đầu vào cho lớp ẩn tiếp theo.

Ở đây, một giá trị số được gọi là độ lệch được gán cho mỗi perceptron, được liên kết với trọng số của mỗi đầu vào. Hơn nữa, mỗi perceptron được chuyển qua kích hoạt hoặc một hàm biến đổi để xác định xem một perceptron cụ thể có được kích hoạt hay không.

cách cảnh báo trong javascript

Một perceptron được kích hoạt được sử dụng để truyền dữ liệu đến lớp tiếp theo. Theo cách này, dữ liệu được truyền (Truyền về phía trước) thông qua mạng nơron cho đến khi các perceptron đến lớp đầu ra.

Tại lớp đầu ra, một xác suất được suy ra để quyết định xem dữ liệu thuộc lớp A hay lớp B.

Nghe có vẻ đơn giản, phải không? Chà, khái niệm về Mạng thần kinh hoàn toàn dựa trên hoạt động của não người. Bạn yêu cầu kiến ​​thức chuyên sâu về các khái niệm và thuật toán toán học khác nhau. Đây là danh sách các blog giúp bạn bắt đầu:

  1. Học sâu là gì? Bắt đầu với Học sâu
  2. Học sâu với Python: Hướng dẫn cho người mới bắt đầu học sâu

Nếu bạn thấy blog này có liên quan, hãy xem của Edureka, một công ty học trực tuyến đáng tin cậy với mạng lưới hơn 250.000 người học hài lòng trải dài trên toàn cầu. Khóa học Edureka Deep Learning with TensorFlow Certificate Training giúp người học trở thành chuyên gia trong việc đào tạo và tối ưu hóa mạng nơron cơ bản và tích hợp bằng cách sử dụng các dự án và bài tập thời gian thực cùng với các khái niệm như hàm SoftMax, Mạng thần kinh mã hóa tự động, Máy Boltzmann hạn chế (RBM).