Dremel của Google là described here. Sự khác biệt giữa Dremel và Mapreduce là gì?Dremel của Google là gì? Nó khác với Mapreduce như thế nào?
Trả lời
Kiểm tra điều này article. Dremel là cái tương lai của tổ ong nên (và sẽ).
Vấn đề chính của MapReduce và các giải pháp trên đầu trang của nó, như Pig, Hive, vv là họ có độ trễ vốn có giữa chạy công việc và nhận câu trả lời. Dremel sử dụng một cách tiếp cận hoàn toàn mới lạ (ra mắt trong năm 2010 trong bài báo rằng bằng google) mà ...
... sử dụng một động cơ thực hiện truy vấn cuốn tiểu thuyết dựa trên cây aggregator ...
. ..để chạy hầu hết thời gian thực, tương tác VÀ adhoc truy vấn cả hai không thể MapReduce. Và heo và Hive không phải là thời gian thực
Bạn nên theo dõi projects sắp ra khỏi điều này. Có phải là khá mới cho tôi quá ... vì vậy bất kỳ ý kiến chuyên gia khác được chào đón!
Edit: Dremel là những gì tương lai của Hive (và không MapReduce như tôi đã đề cập trước đó) nên. Hive ngay bây giờ cung cấp một giao diện SQL giống như để chạy các công việc MapReduce. Hive có độ trễ rất cao và do đó không thực tế trong phân tích dữ liệu đặc biệt. Dremel cung cấp một SQL rất nhanh như giao diện cho dữ liệu bằng cách sử dụng một kỹ thuật khác với MapReduce.
MapReduce là một thuật toán trừu tượng về cách phân chia vấn đề, phân phối và kết hợp kết quả. Dremel dường như là một công cụ cụ thể để truy vấn và phân tích các tập dữ liệu.
Dremel và MapReduce không thể so sánh trực tiếp được, mà đúng hơn là các công nghệ bổ sung.
MapReduce không được thiết kế đặc biệt để phân tích dữ liệu - thay vào đó là khung phần mềm cho phép thu thập các nút để giải quyết các vấn đề tính toán phân tán cho các tập dữ liệu lớn.
Dremel là công cụ phân tích dữ liệu được thiết kế để nhanh chóng chạy truy vấn trên các tập dữ liệu có cấu trúc lớn (chẳng hạn như tệp nhật ký hoặc sự kiện). Nó hỗ trợ cú pháp giống SQL, nhưng ngoài các phụ lục của bảng, nó là chỉ đọc. Nó không hỗ trợ cập nhật hoặc tạo chức năng, cũng như không có tính năng chỉ mục bảng. Dữ liệu được tổ chức theo định dạng "cột", góp phần vào tốc độ truy vấn rất nhanh. Sản phẩm BigQuery của Google là triển khai Dremel có thể truy cập qua RESTful API.
Hadoop (triển khai mã nguồn mở MapReduce) cùng với phần mềm lưu trữ dữ liệu "Hive", cũng cho phép phân tích dữ liệu cho các tập dữ liệu khổng lồ bằng cú pháp kiểu SQL. Hive về cơ bản biến các truy vấn thành các hàm MapReduce. Ngược lại với việc sử dụng định dạng ColumIO, Hive cố gắng thực hiện truy vấn nhanh chóng bằng cách sử dụng các kỹ thuật như lập chỉ mục bảng.
btw, đầu vào chỉ đọc, nhưng bạn có thể thực hiện đầu ra của các truy vấn Dremel để tái sử dụng trong tương lai –
- 1. CLI/C++ chính xác là gì? Nó khác với C++ bình thường như thế nào?
- 2. "Clean C" là gì và nó khác với tiêu chuẩn C như thế nào?
- 3. Tệp IOR là gì, nó hoạt động như thế nào và nó hoạt động như thế nào?
- 4. [cmdletbinding()] là gì và nó hoạt động như thế nào?
- 5. Máy ứng dụng của Google: RDBMS của nó là gì?
- 6. DCI là gì và nó có thể phù hợp với Rails như thế nào?
- 7. jQuery .focus (1) làm gì? Nó khác với .focus() như thế nào?
- 8. Điều này có nghĩa là gì và nó trợ giúp như thế nào?
- 9. Thuật toán sắp xếp MapReduce hoạt động như thế nào?
- 10. Sự tiến hóa khác biệt là gì và nó so sánh với thuật toán di truyền như thế nào?
- 11. Hadoop: OutputCollector hoạt động như thế nào trong MapReduce?
- 12. Cordova là gì và nó liên quan như thế nào với PhoneGap?
- 13. Dấu thời gian SSMA. Nó là gì, nó được sử dụng như thế nào?
- 14. Độ phức tạp của thời gian A * là gì và nó bắt nguồn như thế nào?
- 15. Khi nói đến MapReduce như thế nào là viên Accumulo ánh xạ tới một HDFS chặn
- 16. MapReduce là phương pháp tốt để phân tích nhật ký máy chủ http như thế nào?
- 17. Google AppEngine: SystemServiceServlet và mối quan hệ của nó với thư mục _ah là gì?
- 18. StringCbprintf là gì và khác nhau như thế nào so với sprintf chung?
- 19. Trong OOP, chuyển tiếp là gì và khác với phái đoàn như thế nào?
- 20. Polyline của Google Maps - Làm thế nào để xóa nó?
- 21. ViewState trong JSF là gì và nó được sử dụng như thế nào?
- 22. "Ném" làm gì và nó hữu ích như thế nào?
- 23. Điều gì đã từng xảy ra với deltree và sự thay thế của nó là gì?
- 24. Trong Ruby "=>" có nghĩa là gì và nó hoạt động như thế nào?
- 25. Func là gì, như thế nào và khi nào nó được sử dụng
- 26. ivy là gì? và nó liên quan đến kiến như thế nào?
- 27. ArrayListMultimap khác với LinkedListMultimap như thế nào?
- 28. % 0 |% 0 là gì và nó hoạt động như thế nào?
- 29. Pyximport là gì và tôi nên sử dụng nó như thế nào?
- 30. Một vùng tên là gì và nó được thực hiện như thế nào trong PHP?
Ok, nhưng phần mềm Storm thì sao? – kirugan
Muốn thêm vào các chi tiết trên, hãy xem Apache Drill, đây là một triển khai mã nguồn mở của Dremel của Google. –