Tôi đã nghe một cụm từ mới Hồ dữ liệu. Tôi googled và nhận rằngHồ dữ liệu Hadoop Vs
Hồ dữ liệu là kho lưu trữ và công cụ xử lý có quy mô lớn. Một hồ dữ liệu cung cấp "dung lượng lớn cho bất kỳ loại dữ liệu nào, sức mạnh xử lý khổng lồ và khả năng xử lý hầu như không giới hạn nhiệm vụ hoặc công việc"
Hồ dữ liệu thuật ngữ thường được kết hợp với bộ nhớ đối tượng Hadoop. Trong một kịch bản như vậy, dữ liệu của tổ chức lần đầu tiên được tải vào nền tảng Hadoop, sau đó các công cụ phân tích và khai phá dữ liệu được áp dụng cho dữ liệu mà nó nằm trên các nút cụm máy tính của Hadoop.
Điều tương tự cũng được thực hiện bởi Hadoop. Chúng tôi có HDFS để lưu trữ và MapReduce cho tính toán. Tôi hơi bối rối về Hadoop và hồ Dữ liệu. Sự khác biệt giữa cả hai. Nếu họ giống nhau thì tại sao thuật ngữ này lại phát sinh. Hoặc cách xác định hồ dữ liệu.
một khung công tác chọn và sử dụng nhiều hơn cho phân tích kinh doanh? hadoop cần hiểu thêm về cách tích hợp thuật toán phân tích bên ngoài vào MapReduce nếu tôi không nhầm – AchmadJP
tôi nghèo tôi đã nghe về nó ngày hôm nay. LOL –