Tổng quan về kiến ​​trúc lưu trữ HBase



Ở đó, kiến ​​trúc lưu trữ HBase bao gồm nhiều thành phần. Hãy xem các chức năng của các thành phần này và biết cách dữ liệu đang được ghi.

Apache HBase là cơ sở dữ liệu mã nguồn mở, phân tán, không quan hệ, được mô hình hóa theo Bigtable của Google và được viết bằng Java. Nó cung cấp các khả năng tương tự như Bigtable trên Hadoop và HDFS (Hadoop Distributed Filesystem), tức là nó cung cấp một cách có khả năng chịu lỗi để lưu trữ số lượng lớn dữ liệu thưa thớt, thường gặp trong nhiều trường hợp sử dụng dữ liệu lớn. HBase được sử dụng để truy cập đọc / ghi dữ liệu lớn trong thời gian thực.





cách đặt đường dẫn java trong windows

Kiến trúc lưu trữ HBase bao gồm nhiều thành phần. Hãy xem các chức năng của các thành phần này và biết cách dữ liệu đang được ghi.

HFiles:



HFiles tạo thành cấp độ thấp của kiến ​​trúc HBase. HFiles là các tệp lưu trữ được tạo để lưu trữ dữ liệu của HBase nhanh chóng và hiệu quả.

HMaster:

HMaster chịu trách nhiệm chỉ định các vùng cho mỗi HRegionServer khi HBase được khởi động. Nó chịu trách nhiệm quản lý mọi thứ liên quan đến hàng, bảng và các hoạt động phối hợp của chúng. Hmaster cũng có các chi tiết về siêu dữ liệu.



Các thành phần của HBase:

HBase có các thành phần sau:

  • Bảng - Bao gồm các khu vực
  • Vùng - Phạm vi các hàng được lưu trữ cùng nhau
  • Máy chủ Vùng - Phục vụ một hoặc nhiều vùng
  • Master Server - Daemon chịu trách nhiệm quản lý cụm HBase

HBase lưu trữ dữ liệu trực tiếp vào HDFS và phụ thuộc rất nhiều vào Tính khả dụng cao và khả năng chịu lỗi của HDFS.

Kiến trúc lưu trữ HBase:

Kiến trúc lưu trữ HBase

cách tạo một bản sao sâu trong java

Quy trình chung là Khách hàng liên hệ với Zookeeper trước để tìm một khóa hàng cụ thể. Nó làm như vậy bằng cách lấy tên máy chủ từ Zookeeper. Với thông tin này, bây giờ nó có thể truy vấn máy chủ đó để lấy máy chủ có thể đáp ứng được. Cả hai chi tiết này đều được lưu vào bộ nhớ đệm và chỉ được tra cứu một lần. Cuối cùng, nó có thể truy vấn máy chủ siêu tốc và truy xuất máy chủ có hàng mà máy khách đang tìm kiếm.

Khi nó biết hàng nằm ở khu vực nào, nó cũng lưu trữ thông tin này và liên hệ trực tiếp với HRegionServer. Vì vậy, theo thời gian, Khách hàng có đầy đủ thông tin về nơi lấy các hàng mà không cần truy vấn lại máy chủ siêu tốc. Khi HRegion được mở, nó sẽ thiết lập một phiên bản Store cho mỗi HColumnFamily cho mỗi bảng. Dữ liệu được ghi khi Khách hàng đưa ra yêu cầu tới HRegionServer cung cấp thông tin chi tiết cho phiên bản HRegion phù hợp. Bước đầu tiên là chúng ta phải quyết định xem dữ liệu có nên được ghi đầu tiên vào ‘Write-Ahead-Log’ (WAL) được đại diện bởi lớp HLog hay không. Quyết định dựa trên cờ do khách hàng thiết lập.
Khi dữ liệu được ghi vào WAL, nó sẽ được đặt trong MemStore. Đồng thời, Memstore được kiểm tra xem nó đã đầy chưa và trong trường hợp đó, yêu cầu xả ra đĩa. Sau đó, dữ liệu được ghi vào HFile.

cách đặt đường dẫn java trong windows

Có một câu hỏi cho chúng tôi? Đề cập đến họ trong phần bình luận và chúng tôi sẽ liên hệ lại với bạn.

Bài viết liên quan

Thông tin chi tiết về Kiến trúc HBase