2014-07-02 46 views
5

Tôi đang cố gắng hiểu cách viết dữ liệu được quản lý trong HDFS bằng cách đọc hadoop-2.4.1 documentation.Dữ liệu được ghi bằng HDFS như thế nào?

Theo sơ đồ sau:

HDFS architecture

bất cứ khi nào một khách hàng viết một cái gì đó để HDFS, ông không có tiếp xúc với namenode và chịu trách nhiệm về chunking và nhân rộng. Tôi giả định rằng trong trường hợp này, máy khách là một máy chạy vỏ HDFS (hoặc tương đương).

Tuy nhiên, tôi không hiểu cách quản lý này. Thật vậy, theo cùng một tài liệu:

DataNodes cũng thực hiện tạo, xóa và nhân bản khi được hướng dẫn từ NameNode.

Sơ đồ được trình bày ở trên có đúng không? Nếu vậy,

  • là tên nút chỉ được thông báo về tệp mới khi nhận được Blockreport (có thể mất thời gian, tôi giả sử)?
  • tại sao khách hàng ghi vào nhiều nút?

    Nếu lược đồ này không đúng, cách tạo tệp hoạt động với HDF?

Trả lời

2

Như bạn đã nói, DataNodes chịu trách nhiệm phân phối yêu cầu đọc/ghi và tạo/xóa/nhân bản khối.

Sau đó, họ gửi một cách thường xuyên “Heartbeats” (tình trạng báo cáo y tế)“BlockReport” (danh sách các khối trên DataNode) đến NameNode.

Theo this article:

liệu Nodes gửi heartbeat với Tên Node mỗi 3 giây qua một cái bắt tay TCP ... Mỗi nhịp tim thứ mười là một Báo cáo Khối, nơi dữ liệu Nút cho biết tên nút về tất cả các khối nó có.

Vì vậy, báo cáo khối được thực hiện cứ 30 giây một lần, tôi không nghĩ rằng điều này có thể ảnh hưởng đến công việc Hadoop vì nói chung họ là những công việc độc lập.

Đối với câu hỏi của bạn:

tại sao khách hàng ghi vào nhiều nút?

tôi sẽ nói rằng trên thực tế, khách hàng ghi vào chỉ là một datanode và nói với anh ấy để gửi dữ liệu đến datanodes khác (thấy link ảnh này: KHÁCH HÀNG BẮT ĐẦU VIẾT DỮ LIỆU), nhưng điều này là minh bạch. Đó là lý do tại sao lược đồ của bạn xem xét rằng máy khách là người ghi nhiều nút

+0

Theo bài viết bạn đã liên kết, máy khách sẽ yêu cầu viết các khối vào nút tên trước (http: //bradhedlund.s3.amazonaws. com/2011/hadoop-network-intro/Viết-Files-to-HDFS-s.png). Điều đó sẽ làm cho lược đồ trên sai, đó là cốt lõi của câu hỏi của tôi :) Bạn có thể xác nhận nó? – fxm

+1

Có, tôi nghĩ, hãy xem [link] awsome này (http://bigdatahandler.com/wp-content/uploads/2013/10/HDFS.pdf). – Mouna

Các vấn đề liên quan