Làm thế nào để chạy Hive Scripts?



Đây là hướng dẫn về cách chạy Hive Scripts. Chạy tập lệnh này sẽ giảm thời gian và công sức chúng ta bỏ ra để viết và thực hiện từng lệnh theo cách thủ công.

Là một gói Data Warehousing được xây dựng dựa trên Hadoop, Apache Hive ngày càng được sử dụng nhiều hơn để phân tích dữ liệu, khai thác dữ liệu và mô hình dự đoán. Các tổ chức đang tìm kiếm các chuyên gia có khả năng nắm giữ . Trong bài đăng này, hãy xem cách chạy Hive Scripts. Nói chung, chúng tôi sử dụng các tập lệnh để thực thi một tập hợp các câu lệnh cùng một lúc. Hive Scripts được sử dụng khá nhiều theo cách tương tự. Nó sẽ giảm thời gian và công sức chúng ta bỏ ra để viết và thực hiện từng lệnh theo cách thủ công.

Hive Scripts được hỗ trợ trong các phiên bản Hive 0.10.0 trở lên. Vì phiên bản Hive 0.90 được cài đặt trong CDH3, chúng tôi không thể chạy Hive Scripts trong CDH3. Bạn có thể thử các bước dưới đây trong CDH4 vì nó đã cài đặt phiên bản Hive 0.10.0. Bạn có biết cách tạo tập lệnh Hive không? Nếu không, hãy nhấp vào để hiểu rõ hơn.





Master-Hive-Now

Bây giờ, chúng ta hãy xem cách viết các tập lệnh trong Hive và chạy chúng trong CDH4:



Bước 1: Viết kịch bản Hive.

Để viết Hive Script, tệp phải được lưu với phần mở rộng .sql. Mở một thiết bị đầu cuối trong bản phân phối Cloudera CDH4 của bạn và đưa ra lệnh sau để tạo Hive Script.
Chỉ huy: sudo gedit sample.sql

Khi thực hiện lệnh trên, nó sẽ mở tệp với danh sách tất cả các lệnh Hive cần được thực hiện.



Trong tập lệnh này, một bảng sẽ được tạo, mô tả và dữ liệu sẽ được tải và truy xuất từ ​​bảng.

1. Tạo Bảng trong Hive:

Chỉ huy: tạo sản phẩm bảng (sản phẩm: int, productname: string, price: float, category: string) định dạng hàng các trường được phân tách bằng dấu ‘,’

Ở đây, product là tên bảng và {yitid, productname, price, category} là các cột của bảng này.

Các trường kết thúc bằng dấu ‘,’ chỉ ra rằng các cột trong tệp đầu vào được phân tách bằng ký hiệu ‘,’.

Theo mặc định, các bản ghi trong tệp đầu vào được phân tách bằng một dòng mới.

2. Mô tả Bảng:

Chỉ huy: mô tả sản phẩm

3. Tải dữ liệu vào bảng.

Để tải dữ liệu vào bảng trước tiên chúng ta cần tạo một tệp đầu vào chứa các bản ghi cần được chèn vào bảng.

Hãy để chúng tôi tạo một tệp đầu vào.

Chỉ huy: sudo gedit input.txt

Chỉnh sửa nội dung trong tệp như trong hình.

4. Lấy dữ liệu:

Để truy xuất dữ liệu, lệnh select được sử dụng.

Chỉ huy: Chọn * từ sản phẩm

Lệnh trên được sử dụng để lấy giá trị của tất cả các cột có trong bảng. Tập lệnh sẽ giống như nó được hiển thị trong hình ảnh bên dưới.

Bây giờ, chúng ta đã hoàn tất việc viết kịch bản Hive. Tệp sample.sql hiện có thể được lưu.

cách tạo một gói java

Bước 2: Chạy tập lệnh Hive

Sau đây là lệnh để chạy tập lệnh Hive:

Chỉ huy: hive –f /home/cloudera/sample.sql

Trong khi thực thi tập lệnh, hãy đảm bảo rằng toàn bộ đường dẫn của vị trí của tập lệnh có sẵn.

Chúng ta có thể thấy rằng tất cả các lệnh đều được thực hiện thành công.

Đây là cách các tập lệnh Hive được chạy và thực thi trong CDH4.

Hive là một thành phần quan trọng của Hadoop và kiến ​​thức chuyên môn của bạn về Hive có thể mang đến cho bạn những công việc Hadoop được trả lương cao nhất! Edureka có một khóa học Hadoop được tuyển chọn đặc biệt giúp bạn nắm vững các khái niệm như MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume và Sqoop. Bấm vào nút bên dưới để bắt đầu.

Có một câu hỏi cho chúng tôi? Vui lòng đề cập đến chúng trong phần nhận xét và chúng tôi sẽ liên hệ lại với bạn.

Bài viết liên quan:

Lệnh Hive

Mô hình dữ liệu Hive