Các trường hợp sử dụng Apache Storm



Apache Storm phổ biến vì nó có các tính năng xử lý thời gian thực và đã được triển khai vì lý do này. Dưới đây là một số trường hợp sử dụng Apache Storm.

Apache Storm phổ biến vì nó có các tính năng xử lý thời gian thực và nhiều tổ chức đã triển khai nó như một phần của hệ thống của họ vì lý do này. Hãy xem cách các tổ chức đang tích hợp Apache Storm.





Các trường hợp sử dụng Apache Storm:

Twitter

Storm được sử dụng để cung cấp năng lượng cho nhiều hệ thống Twitter như phân tích thời gian thực, cá nhân hóa, tìm kiếm, tối ưu hóa doanh thu và nhiều hơn nữa. Apache Storm đồng hóa với phần còn lại của cơ sở hạ tầng của Twitter, bao gồm các hệ thống cơ sở dữ liệu như Cassandra, Memcached, v.v., cơ sở hạ tầng nhắn tin, Mesos và các hệ thống giám sát & cảnh báo. Bộ lập lịch trình cách ly của Storm giúp khả thi khi sử dụng cùng một cụm cho các ứng dụng sản xuất và ứng dụng đang phát triển. Nó cung cấp một cách hiệu quả để lập kế hoạch năng lực.

truyền gấp đôi sang int java

Yahoo!
Yahoo! đang làm việc trên một nền tảng thế hệ tiếp theo cho phép hợp nhất Dữ liệu lớn và xử lý độ trễ thấp. Mặc dù Hadoop là công nghệ chính được sử dụng ở đây để xử lý hàng loạt, Apache Storm cho phép xử lý luồng các sự kiện của người dùng, nguồn cấp nội dung và nhật ký ứng dụng.



Infochimps
Infochimps sử dụng Apache Storm làm nguồn cho một trong ba dịch vụ dữ liệu đám mây của mình - Dịch vụ cung cấp dữ liệu (DDS), sử dụng Storm để cung cấp dịch vụ thu thập, vận chuyển dữ liệu doanh nghiệp có khả năng mở rộng tuyến tính và khả năng chịu lỗi và dịch vụ đám mây xử lý trong luồng phức tạp . Tương tự như Hadoop, cung cấp ETL hàng loạt và xử lý phân tích hàng loạt quy mô lớn, DDS cũng cung cấp ETL thời gian thực và xử lý thời gian thực quy mô lớn.

Bảng lật
Flipboard là một nơi duy nhất để khám phá, thu thập và chia sẻ tin tức mà bạn quan tâm. Flipboard sử dụng Storm cho một loạt các dịch vụ như tìm kiếm nội dung, phân tích thời gian thực, nguồn cấp tạp chí tùy chỉnh, v.v. Apache Storm được tích hợp với cơ sở hạ tầng bao gồm các hệ thống như ElasticSearch, Hadoop, HBase và HDFS, để tạo ra nền tảng dữ liệu có khả năng mở rộng cao.

Ooyala
Ooyala là một công ty tư nhân được hỗ trợ bởi liên doanh cung cấp các sản phẩm và dịch vụ công nghệ video trực tuyến cho một số mạng, thương hiệu và công ty truyền thông lớn nhất thế giới. Ooyala có một công cụ phân tích xử lý hơn hai tỷ sự kiện phân tích mỗi ngày, được tạo ra từ gần 200 triệu người xem trên toàn thế giới xem video trên một trình phát do Ooyala hỗ trợ. Ooyala sử dụng Apache Storm để cung cấp cho khách hàng của họ phân tích phát trực tuyến theo thời gian về hành vi xem của người tiêu dùng và xu hướng nội dung kỹ thuật số. Storm cho phép khai thác nhanh chóng các tập dữ liệu video trực tuyến của họ để cung cấp thông tin kinh doanh hiện tại như xem mẫu thời gian thực, đề xuất nội dung được cá nhân hóa, hướng dẫn lập trình và thông tin chi tiết có giá trị về các cách tăng doanh thu.



Taobao
Taobao, với sự trợ giúp của Apache Storm, tạo thống kê nhật ký và trích xuất thông tin hữu ích từ số liệu thống kê trong thời gian thực. Nhật ký được đọc từ các hàng đợi tin nhắn liên tục thành các vòi, được xử lý và sau đó được chuyển đến các cấu trúc liên kết, để tính toán các kết quả cần thiết. Số lượng nhật ký đầu vào của Taobao thay đổi trong khoảng từ 2 triệu đến 1,5 tỷ mỗi ngày.

Klout
Klout là một ứng dụng sử dụng phân tích phương tiện truyền thông xã hội để xếp hạng người dùng dựa trên ảnh hưởng xã hội trực tuyến thông qua 'Điểm Klout', là một giá trị số từ 1 đến 100. Klout sử dụng tính trừu tượng Trident được tích hợp sẵn của Apache Storm để tạo các cấu trúc liên kết phức tạp truyền dữ liệu từ bộ thu mạng thông qua Kafka, sau đó được xử lý và ghi vào HDFS.

Chúng tôi đi
Wega là công cụ tìm kiếm du lịch toàn diện của thế giới, hoạt động trên toàn thế giới và được vô số khách du lịch sử dụng để có nhiều lựa chọn hơn để trả ít hơn và đi du lịch nhiều hơn. Wego so sánh và hiển thị lịch trình chuyến bay theo thời gian thực, tình trạng sẵn có của khách sạn, giá cả và hiển thị các trang web du lịch khác trên toàn cầu. Tại đây, Apache Storm truyền dữ liệu metasearch theo thời gian thực từ các chi nhánh tới người dùng cuối. Các khái niệm cấu trúc liên kết trong Storm giải quyết các vấn đề đồng thời và đồng thời giúp chúng tích hợp, mổ xẻ và làm sạch dữ liệu một cách liên tục. Ngoài ra, các công cụ được cung cấp trong Storm cho phép cập nhật gia tăng để nâng cao dữ liệu của họ.

làm thế nào để so sánh hai chuỗi

Nhiên liệu tên lửa
Rocket Fuel cung cấp nền tảng mua phương tiện hàng đầu ở quy mô Dữ liệu lớn, khai thác sức mạnh của trí tuệ nhân tạo (AI) để mở rộng ROI tiếp thị trong phương tiện kỹ thuật số. Họ đang xây dựng một nền tảng thời gian thực trên Storm, bắt chước các luồng công việc quan trọng về thời gian đã tồn tại trong đường ống ETL dựa trên Hadoop. Nền tảng này theo dõi số lần hiển thị, nhấp chuột, chuyển đổi, yêu cầu giá thầu, v.v. trong thời gian thực.

Navsite
Navsite đang sử dụng Apache Storm như một phần của hệ thống kiểm tra và giám sát nhật ký sự kiện máy chủ của họ. Các thông báo nhật ký từ hàng nghìn máy chủ được gửi đến cụm RabbitMQ và Storm được sử dụng để so sánh từng thông báo với một tập hợp các biểu thức chính quy. Nếu có sự trùng khớp, thì thông báo sẽ được gửi đến một chốt lưu trữ dữ liệu trong MongoDB. Hiện tại, 5-10 nghìn tin nhắn mỗi giây đang được xử lý, tuy nhiên, các cụm RabbitMQ + Storm hiện có đã được thử nghiệm lên đến khoảng 50k mỗi giây.

Có rất nhiều tổ chức khác đang triển khai Apache Storm và thậm chí nhiều hơn nữa dự kiến ​​sẽ tham gia trò chơi này, vì Apache Storm đang tiếp tục dẫn đầu trong phân tích thời gian thực.

Kiểm tra của chúng tôi .