Tôi đang cố gắng hiểu cách viết dữ liệu được quản lý trong HDFS bằng cách đọc hadoop-2.4.1 documentation.Dữ liệu được ghi bằng HDFS như thế nào?
Theo sơ đồ sau:
bất cứ khi nào một khách hàng viết một cái gì đó để HDFS, ông không có tiếp xúc với namenode và chịu trách nhiệm về chunking và nhân rộng. Tôi giả định rằng trong trường hợp này, máy khách là một máy chạy vỏ HDFS (hoặc tương đương).
Tuy nhiên, tôi không hiểu cách quản lý này. Thật vậy, theo cùng một tài liệu:
DataNodes cũng thực hiện tạo, xóa và nhân bản khi được hướng dẫn từ NameNode.
Sơ đồ được trình bày ở trên có đúng không? Nếu vậy,
- là tên nút chỉ được thông báo về tệp mới khi nhận được Blockreport (có thể mất thời gian, tôi giả sử)?
tại sao khách hàng ghi vào nhiều nút?
Nếu lược đồ này không đúng, cách tạo tệp hoạt động với HDF?
Theo bài viết bạn đã liên kết, máy khách sẽ yêu cầu viết các khối vào nút tên trước (http: //bradhedlund.s3.amazonaws. com/2011/hadoop-network-intro/Viết-Files-to-HDFS-s.png). Điều đó sẽ làm cho lược đồ trên sai, đó là cốt lõi của câu hỏi của tôi :) Bạn có thể xác nhận nó? – fxm
Có, tôi nghĩ, hãy xem [link] awsome này (http://bigdatahandler.com/wp-content/uploads/2013/10/HDFS.pdf). – Mouna