2012-02-01 42 views
5

Tôi là người mới đến Hadoop. Tôi đã được đọc rằng HDFS chủ yếu là về "viết một lần, đọc bất cứ lúc nào". Tôi có một trường hợp sử dụng mà tôi có thể phải sửa đổi các tệp được lưu trữ trong HDFS. Tôi đã nghiên cứu nếu có bất kỳ cách nào để làm điều này.Cập nhật tệp hadoop HDFS

Câu hỏi của tôi là có thể tải tệp HDFS vào HBase, thực hiện các sửa đổi và lưu lại trong HDFS và xóa tệp gốc. Xin vui lòng cho tôi nếu điều này khả thi.

Trả lời

4

Nếu bạn cần cập nhật giá trị trong tệp, bạn nên sử dụng HBase tốt hơn nhiều. Bạn vẫn có thể sử dụng bảng HBase của bạn trong các công việc MR của bạn thông qua TableInputFormat và TableOutputFormat. Nếu bạn muốn nối thêm dữ liệu, bạn có thể sử dụng bất kỳ phiên bản hadoop nào hỗ trợ hdfs nối thêm như 0.20.205.0.

+0

Cảm ơn Steve. Tôi có thể làm randow viết trong tập tin hdfs bằng cách sử dụng HBase hoặc là nó chỉ nối? –

+0

Bạn có thể sửa đổi các bản ghi trong cơ sở một cách ngẫu nhiên. –

+0

Steve tôi đã xây dựng một bảng Hbase có thể trên một tập tin HDFS. khi tôi cố cập nhật bản ghi Hbase bằng lệnh 'Đặt' đơn giản, tôi không thể thấy các thay đổi trong HDFS? Không nên tự động cập nhật? – Ragav

Các vấn đề liên quan