OLTP so với OLAP



Blog sau đây nói ngắn gọn về OLTP và OLAP và các trường hợp sử dụng khác nhau.

OLTP so với OLAP

OLTP được cho là giống một hệ thống giao dịch trực tuyến hoặc hệ thống lưu trữ dữ liệu, nơi người dùng thực hiện nhiều giao dịch trực tuyến bằng cách sử dụng kho dữ liệu. Nó cũng được cho là có nhiều lượt đọc / ghi đặc biệt hơn diễn ra trên cơ sở thời gian thực.





OLAP là một kho lưu trữ dữ liệu ngoại tuyến. Nó được truy cậpsố lầntrong thời trang ngoại tuyến. Ví dụ: các tệp nhật ký hàng loạt được đọc và sau đó được ghi lại vào tệp dữ liệu. Một số lĩnh vực phổ biến mà OLAP được sử dụng là Công việc ghi nhật ký, Công việc khai thác dữ liệu, v.v.

Cassandra được cho là giống với OLTP hơn, vì nó là thời gian thực, trong khi Hadoop giống với OLAP hơn, vì nó được sử dụng để phân tích và ghi hàng loạt.



Tại sao nên tích hợp OLAP & OLTP?

Nếu trong trường hợp bạn đang tìm giá đặt phòng khách sạn rẻ nhất trong 365 ngày tới, thì ở đây bạn có một bộ dữ liệu khổng lồ cho Cassandra và muốn có đề xuất trên cơ sở dữ liệu thời gian thực, một chương trình khuyến mãi sẽ được chạy dựa trên giá.

chuyển đổi nhị phân sang java thập phân

Trong một tình huống như vậy, chúng tôi phải lặp lại tất cả các bản ghi và luôn cập nhật các số liệu phân tích, đây là một công việc ngoại tuyến khổng lồ phải được bắt đầu thường xuyên. Ở đây, Hadoop được sử dụng để xử lý dữ liệu hàng loạt.

Lợi ích khác là chúng ta có thể chạy một cụm và hủy chạy một cụm Hadoop khác.



kết hợp dữ liệu hoạt cảnh không hoạt động

Lợi ích thứ ba là người ta cũng có thể giảm rất nhiều chi phí vận hành.

Đưa ra một tình huống, trong đó, nếu người dùng thành thạo các Hệ thống sinh thái Hadoop khác nhau, như Hive, Pig Latin và cần tích hợp dữ liệu vào đó, thì người dùng phải cắm một số nguồn dữ liệu vào Cassandra và cố gắng chạy Map Giảm việc làm là tốt.

Có một mô hình đáng chú ý giữa OLTP và OLAP. Trong OLTP, số lần ghi ít hơn, ví dụ: Thông tin khách sạn. Giả sử rằng các thay đổi về Giá xảy ra cứ sau 5000 lần mỗi giây, số lần đọc có thể nhiều hơn ở đây. Trong trường hợp như vậy, có thể có 1 lần ghi mỗi giây nhưng số lần đọc có thể tăng lên hàng trăm và hàng nghìn. Vì vậy, tỷ lệ ở đây là khoảng 1: 1000.

Một quan sát thú vị là Cassandra có thể lắp vào mô hình này một cách dễ dàng, bao gồm các mô hình, nơi đọc / ghi là ngang nhau. Ngoài ra, khi nói đến OLTP, ngay cả khi người ta đi vào mô hình nhất quán có thể điều chỉnh và mạnh mẽ, người ta có thể thấy khoảng cách mili giây giữa các mô hình nhất quán cuối cùng và các mô hình nhất quán mạnh nhất. Do đó, Cassandra có thể phù hợp với OLTP.

Đến với OLAP, người ta có thể thấy các mẫu OLAP khác nhau, có nghĩa là có một số lần ghi xảy ra đồng thời. Trong OLAP, chúng tôi kết xuất dữ liệu trong một lần, tức là tất cả các tệp nhật ký được đưa vào kho dữ liệu và sau đó chúng tôi bắt đầu xử lý. Mẫu dữ liệu hoặc mẫu truy cập hoàn toàn ngược lại với loại ứng dụng OLTP. Ở đây, Hadoop hoặc MapReduce sẽ hữu ích.

lớp ẩn danh trong java]

Có một câu hỏi cho chúng tôi? Đề cập đến họ trong phần bình luận và chúng tôi sẽ liên hệ lại với bạn.

Bài viết liên quan:

5 lý do hàng đầu để học Cassandra