Apache Falcon: Nền tảng quản lý dữ liệu mới cho hệ sinh thái Hadoop



Apache Falcon là một nền tảng quản lý dữ liệu mới cho hệ sinh thái Hadoop giúp đơn giản hóa quá trình tích hợp nguồn cấp dữ liệu và quản lý nguồn cấp dữ liệu trên các cụm hadoop. Tìm hiểu cách thiết lập nó.

Apache Falcon là một khuôn khổ để quản lý vòng đời dữ liệu trong các cụm Hadoop. Nó thiết lập mối quan hệ giữa các dữ liệu và phần tử xử lý khác nhau trên môi trường Hadoop, đồng thời cũng cung cấp các dịch vụ quản lý nguồn cấp dữ liệu như lưu giữ nguồn cấp dữ liệu, sao chép giữa các cụm, lưu trữ, v.v.





Đầu tiên chúng ta hãy thảo luận về cách thiết lập Apache Falcon. Chạy lệnh dưới đây để tải xuống kho lưu trữ git của Falcon:

Chỉ huy: git clone https://git-wip-us.apache.org/repos/asf/falcon.git falcon



git-command-apache-falcon

Để chạy chim ưng, bạn cần phải xây dựng nó trước.

Chỉ huy: chim ưng cd



Chỉ huy: export MAVEN_OPTS = ”- Xmx1024m -XX: MaxPermSize = 256m -noverify” && mvn clean install -DskipTests

Chỉ huy: mvn clean assembly: assembly -DskipTests -DskipITs

Khi bạn đã xây dựng falcon, bạn sẽ tìm thấy một gói falcon bên trong thư mục / falcon / distro / target /.

đọc và ghi tệp excel trong java

Các lệnh xây dựng chim ưng trông rất dễ dàng, nhưng bạn sẽ phải đối mặt với rất nhiều vấn đề trước khi nhìn thấy thông báo Xây dựng thành công. Tôi đã gặp phải rất nhiều vấn đề khi xây dựng nó cho Hadoop-2.2.0

Vì vậy, để bỏ qua những khó khăn khi xây dựng Falcon, tôi cung cấp cho bạn một gói falcon được xây dựng thành công, bạn có thể tải xuống bằng liên kết bên dưới.

https://edureka.wistia.com/medias/xw5cfzqmho/download?media_file_id=124642564

Giải nén tệp để lấy thư mục falcon-0.10.

Chỉ huy: giải nén falcon-0.10-SNAPSHOT.zip

Đặt biến môi trường flacon trong tệp .bashrc.

Chỉ huy: sudo gedit .bashrc

Chỉ huy: nguồn .bashrc

Bạn có thể vào thư mục falcon và xem các tệp và thư mục bên trong nó.

Chỉ huy: cd falcon-0.10-SNAPSHOT /

Chỉ huy: ls

Bạn có thể tìm thấy các tập lệnh falcon trong thư mục bin.

Chạy lệnh dưới đây để khởi động Falcon.

Chỉ huy: ./bin/falcon-start

Bạn sẽ thấy một daemon FalconServer mới đang chạy ngay bây giờ.

Lệnh: jps

Chỉ huy: ./bin/falcon admin -version

Mở trình duyệt của bạn và truy cập localhost: 15000 . Bạn có thể xem ui web Falcon.

Có một câu hỏi cho chúng tôi? Đề cập đến họ trong phần bình luận và chúng tôi sẽ liên hệ lại với bạn.

Bài viết liên quan:

Khoan trên Apache Drill