tôi biết rằng đây là một chủ đề cũ hơn nhưng đã có một số phát triển trong năm qua hoặc lâu hơn. So sánh kho dữ liệu với Hadoop giống như so sánh táo với cam. Kho dữ liệu là một khái niệm: sạch sẽ, tích hợp dữ liệu chất lượng cao. Tôi không nghĩ nhu cầu về kho dữ liệu sẽ biến mất sớm. Mặt khác, Hadoop là một công nghệ. Nó là một khung tính toán phân tán để xử lý khối lượng lớn dữ liệu. Trong kho dữ liệu trước đây thường được xây dựng trên cơ sở dữ liệu quan hệ và các thiết bị kho dữ liệu. Tuy nhiên, trong vài năm gần đây, những hạn chế khác nhau của RDBMS đã nổi lên (bùng nổ chi phí giấy phép khi đối mặt với khối lượng dữ liệu ngày càng tăng, phù hợp với mục đích truy vấn đồ thị và phân cấp và ăn các loại dữ liệu phi cấu trúc, vv). Đồng thời các công cụ truy vấn SQL của MPP trên Hadoop đã xuất hiện như là Apache Drill mà bây giờ làm cho nó có thể truy vấn dữ liệu nằm trên Hadoop.
Tôi đã viết toàn bộ chuỗi bài đăng về chủ đề nếu bạn quan tâm đến tất cả các chi tiết. Data Warehousing in the age of big data. The end of an era?
Nguồn
2015-06-16 09:26:21