Storm so sánh với Hadoop như thế nào? Hadoop dường như là tiêu chuẩn defacto cho xử lý hàng loạt quy mô lớn nguồn mở, Storm có bất kỳ lợi thế nào so với hadoop không? hoặc Họ hoàn toàn khác nhau?Apache Storm so với Hadoop
Trả lời
Tại sao bạn không cho biết ý kiến của mình.
- http://www.infoq.com/news/2011/09/twitter-storm-real-time-hadoop/
- http://engineering.twitter.com/2011/08/storm-is-coming-more-details-and-plans.html
Twitter Bão đã được chào hàng như thời gian thực Hadoop. Đó là nhiều hơn một tiếp thị cho tiêu thụ dễ dàng.
Chúng giống nhau về mặt bề ngoài vì cả hai đều là giải pháp ứng dụng được phân phối. Ngoài các yếu tố kiến trúc được phân bố điển hình như chủ/nô lệ, phối hợp dựa trên sở thú, để tôi so sánh rơi khỏi vách đá.
Twitter giống như một đường ống để xử lý dữ liệu khi nó đến. Đường ống là những gì kết nối các nút tính toán khác nhau nhận dữ liệu, tính toán và phân phối đầu ra. (Có lingo là vòi và bu lông) Mở rộng sự tương tự này với một hệ thống đường ống phức tạp có thể được tái thiết kế khi cần thiết và bạn nhận được Twitter Storm.
Vỏ hạt nó xử lý dữ liệu khi nó đến. Không có độ trễ.
Hadoop mức độ khác nhau về mặt này chủ yếu là do HDFS. Đó là một giải pháp hướng tới lưu trữ phân tán và khả năng chịu mất nhiều cân (đĩa, máy móc, giá đỡ vv)
M/R được xây dựng để tận dụng dữ liệu nội địa hóa trên HDFS. Cùng nhau, họ không cung cấp cơ sở để xử lý dữ liệu theo thời gian thực. Nhưng đó không phải luôn luôn là một yêu cầu khi bạn đang tìm kiếm thông qua dữ liệu lớn. (kim trong tương tự haystack)
Tóm lại, Twitter Storm là giải pháp xử lý dữ liệu thời gian thực được phân phối. Tôi không nghĩ chúng ta nên so sánh chúng. Twitter xây dựng nó bởi vì nó cần một cơ sở để xử lý các mẩu tin nhỏ nhưng số lượng hài hước của họ và trong thời gian thực.
Xem: HStreaming nếu bạn bắt buộc phải so sánh nó với một số điều
+1, đồng ý hoàn toàn. Chỉ cần một lưu ý nhỏ: Twitter đã không xây dựng nó, họ [có được] (http://engineering.twitter.com/2011/08/storm-is-coming-more-details-and-plans.html) nó. BackType xây dựng nó ban đầu. – johndodo
@johndodo: Cảm ơn. Tôi hoàn toàn không biết nguồn gốc của nó. – pyfunc
Tương tự đẹp với đường ống dẫn thay đổi cấu trúc liên kết. – SChepurin
Về cơ bản, cả hai đều được sử dụng để phân tích dữ liệu lớn, nhưng cơn bão được sử dụng để chế biến thời gian thực trong khi Hadoop được sử dụng để xử lý hàng loạt.
Đây là một giới thiệu rất tốt Storm mà tôi tìm thấy: Click here
Thay vì được so sánh, họ có nghĩa vụ phải bổ sung mỗi bây giờ có hàng loạt + real-time (thời gian giả thực) chế biến khác. Có một bản trình bày video tương ứng - Ted Dunning on Twitter's Storm
Kiến trúc này có thể được nhân đôi trong môi trường cửa sổ không? – vbNewbie
Khá nhiều thứ có thể được sao chép nhưng tôi nghi ngờ điều này sẽ có bất kỳ ý nghĩa nào được thực hiện trong Windows vì Storm được thiết kế để xử lý "thời gian thực". – SChepurin
Ý của bạn là gì theo "thời gian thực giả", vui lòng mở rộng. – samthebest
Tôi đã sử dụng Storm trong một thời gian và bây giờ tôi đã thoát khỏi công nghệ thực sự tuyệt vời này: Spark (http://spark.apache.org) cung cấp cho nhà phát triển API thống nhất cho hàng loạt hoặc xử lý trực tuyến (vi-batch) cũng như chế tạo máy và xử lý đồ thị.
đáng để thử.
Bão dành cho Dữ liệu nhanh (thời gian thực) & Hadoop dành cho dữ liệu lớn (dữ liệu sẵn có trước đó). Storm không thể xử lý dữ liệu lớn nhưng nó có thể tạo ra dữ liệu lớn làm đầu ra.
Apache Storm là hệ thống tính toán thời gian thực được phân phối miễn phí và mã nguồn mở. Storm giúp việc xử lý các luồng dữ liệu không bị ràng buộc một cách đáng tin cậy, làm cho xử lý thời gian thực những gì Hadoop đã thực hiện để xử lý theo lô.
Vì nhiều hệ thống phụ tồn tại trong hệ sinh thái Hadoop, chúng tôi phải chọn hệ thống phụ phù hợp tùy theo yêu cầu kinh doanh & tính khả thi của một hệ thống cụ thể.
Hadoop MapReduce hiệu quả cho việc xử lý hàng loạt một công việc tại một thời điểm. Đây là lý do tại sao Hadoop được sử dụng rộng rãi như một công cụ kho dữ liệu thay vì công cụ phân tích dữ liệu.
Kể từ khi câu hỏi có liên quan đến chỉ "Bão" vs "Hadoop", có một cái nhìn tại Storm use cases - Các dịch vụ tài chính, viễn thông, bán lẻ, sản xuất, giao thông vận tải.
- Hadoop MapReduce phù hợp nhất để xử lý theo lô.
- Bão là công cụ xử lý luồng hoàn chỉnh và có thể được sử dụng để phân tích dữ liệu theo thời gian thực với thời gian chờ tính theo giây.
Hãy xem dezyre article để so sánh giữa Hadoop, Storm và Spark. Nó giải thích những điểm tương đồng và khác biệt.
Nó có thể được tóm tắt với hình dưới đây (từ dezyre
bài viết)
- 1. Khi nào nên sử dụng Apache so với Apache + Tomcat?
- 2. Storm Crashing sau 23 giờ
- 3. Apache Pivot 1.4 so với JavaFX, Flex, Silverlight, Swing
- 4. Node.js hoạt động như thế nào so với Apache?
- 5. Yii với PHP Storm Auto Complete và Class Recognition
- 6. JBoss RichFaces so với IceFaces so với Apache Trinidad - So sánh các thư viện thành phần JSF
- 7. Đọc Hadoop SequenceFiles với Hive
- 8. Phân tích Hadoop nhanh (Cloudera Impala vs Spark/Shark vs Apache Drill)
- 9. Bắt đầu với MapReduce/Hadoop
- 10. Hadoop khác biệt Distribution
- 11. Làm rõ trường hợp sử dụng cho Hadoop so với RabbitMQ + Cần tây
- 12. netezza hoạt động như thế nào? nó so sánh với Hadoop như thế nào?
- 13. Chỉnh sửa tệp Php Storm từ xa
- 14. Tích hợp Kafka Storm bằng Kafka Spout
- 15. Trạng thái Trident trong Storm là gì?
- 16. Apache Cassandra tích hợp với Apache Solr
- 17. Ngoại lệ trong chủ đề "chính" java.lang.NoClassDefFoundError: org/apache/hadoop/util/PlatformName
- 18. là nó có thể sử dụng apache mahout mà không có phụ thuộc hadoop?
- 19. Apache Pig: Tải một tệp hiển thị tốt bằng cách sử dụng hadoop fs -text
- 20. Ý tưởng dự án với Hadoop MapReduce
- 21. Thiết lập thông số hadoop với boto?
- 22. Lỗi khi cài đặt hadoop với homebrew
- 23. MultipleOutputFormat in hadoop
- 24. Apache Helix vs YARN
- 25. pymssql so với pyodbc so với adodbapi so với ...
- 26. APL so với A so với J so với K?
- 27. Storm vs. Trident: Khi không sử dụng Trident?
- 28. So sánh CQL của Cassandra với các truy vấn Spark/Shark vs Hive/Hadoop (phiên bản DSE)
- 29. Chỉ định giới hạn bộ nhớ với hadoop
- 30. metaphone so với soundex so với NYSIIS
Tôi nghĩ câu hỏi làm toàn toàn hợp lý và thật khó cho tôi để hiểu làm thế nào một câu hỏi hữu ích như đã được đóng cửa như không mang tính xây dựng. Câu hỏi là trực tiếp, không cần sự thật, tài liệu tham khảo, v.v. – mvallebr