2016-03-14 17 views
7

Tôi đã nghe một cụm từ mới Hồ dữ liệu. Tôi googled và nhận rằngHồ dữ liệu Hadoop Vs

Hồ dữ liệu là kho lưu trữ và công cụ xử lý có quy mô lớn. Một hồ dữ liệu cung cấp "dung lượng lớn cho bất kỳ loại dữ liệu nào, sức mạnh xử lý khổng lồ và khả năng xử lý hầu như không giới hạn nhiệm vụ hoặc công việc"

Hồ dữ liệu thuật ngữ thường được kết hợp với bộ nhớ đối tượng Hadoop. Trong một kịch bản như vậy, dữ liệu của tổ chức lần đầu tiên được tải vào nền tảng Hadoop, sau đó các công cụ phân tích và khai phá dữ liệu được áp dụng cho dữ liệu mà nó nằm trên các nút cụm máy tính của Hadoop.

Điều tương tự cũng được thực hiện bởi Hadoop. Chúng tôi có HDFS để lưu trữ và MapReduce cho tính toán. Tôi hơi bối rối về Hadoop và hồ Dữ liệu. Sự khác biệt giữa cả hai. Nếu họ giống nhau thì tại sao thuật ngữ này lại phát sinh. Hoặc cách xác định hồ dữ liệu.

+0

một khung công tác chọn và sử dụng nhiều hơn cho phân tích kinh doanh? hadoop cần hiểu thêm về cách tích hợp thuật toán phân tích bên ngoài vào MapReduce nếu tôi không nhầm – AchmadJP

+0

tôi nghèo tôi đã nghe về nó ngày hôm nay. LOL –

Trả lời

9

Hồ dữ liệu là một "ý tưởng" trừu tượng. Hadoop là công nghệ/phần mềm cụ thể. Bạn có thể thực hiện một hồ dữ liệu bằng cách sử dụng hadoop hoặc sử dụng công cụ khác nhau.

+0

Có nghĩa là HDFS và hồ dữ liệu có thể giống nhau –

+0

@KishoreKumarSuthar HDFS chỉ là một hệ thống tệp. Vậy là không. – Havnar

+0

@Havnar Theo Wikipedia, Có. "Một ví dụ về hồ dữ liệu là hệ thống tệp phân tán được sử dụng trong Apache Hadoop." – Enrique

4

Hồ dữ liệu là phương pháp lưu trữ dữ liệu trong hệ thống tạo điều kiện đối chiếu dữ liệu trong lược đồ biến thể và biểu mẫu cấu trúc, thường là đối tượng hoặc tệp màu.

Khái niệm về hồ dữ liệu gắn chặt với Apache Hadoop và hệ sinh thái của các dự án nguồn mở. Tất cả các cuộc thảo luận của hồ dữ liệu nhanh chóng dẫn đến một mô tả về cách xây dựng một hồ dữ liệu bằng cách sử dụng sức mạnh của hệ sinh thái Apache Hadoop. Nó trở nên phổ biến vì nó cung cấp một cách hiệu quả về mặt công nghệ và khả thi để đáp ứng những thách thức lớn về dữ liệu. Tổ chức đang khám phá hồ dữ liệu dưới dạng sự tiến hóa từ kiến ​​trúc dữ liệu hiện có của họ.

Following whitepaper sẽ hoạt động như một ví dụ thực thi để xây dựng hồ dữ liệu với Hadoop.

1

Tôi muốn nói câu hỏi đó quá giống.

"Oracle vs Cơ sở dữ liệu".

Hồ dữ liệu là phương pháp lưu trữ dữ liệu trong hệ thống hoặc kho lưu trữ. Hadoop tham chiếu đến báo cáo, Hadoop là một khung phần mềm nguồn mở để lưu trữ dữ liệu. Vì vậy, một ví dụ về hồ dữ liệu là hệ thống tệp được phân phối được sử dụng trong Hadoop.

+2

Tôi muốn nói rằng Hồ dữ liệu là một trong những điều bạn có thể làm với Hadoop hoặc công nghệ khác, nhưng không phải tất cả các ứng dụng Hadoop đều là Hồ dữ liệu. – Rich

Các vấn đề liên quan