2011-02-07 32 views
5

Tôi muốn thực hiện một số tính toán với hadoop và mahout trên máy lõi tứ của tôi, vì vậy tôi đang sử dụng hadoop trong chế độ giả phân tán.Quản lý hdfs trong chế độ phân phối giả phân tán

Vấn đề là không gian trên máy chủ gốc của tôi bị giới hạn, vì vậy làm cách nào tôi có thể định cấu hình để sử dụng không gian có sẵn trên một số ổ cứng gắn ngoài khác.

Trả lời

6

Bạn có thể định cấu hình nơi hdfs thu thập dữ liệu của nó. Thêm dòng sau vào conf/HDFS-site.xml của bạn:

<property> 
    <name>dfs.data.dir</name> 
    <value>__path_to_where_you_want_to_store_your_data/hdfs/data/</value> 
</property> 
<property> 
    <name>dfs.name.dir</name> 
    <value>__path_to_where_you_want_to_store_your_data/hdfs/name/</value> 
</property> 

Sau theese thay đổi bạn sẽ phải định dạng namenode của bạn:

hadoop namenode -format

+0

nhưng hadoop không khởi động sau đó. Nó giữ cho thấy namenode đang ở chế độ an toàn – Pankaj

+0

có lẽ bạn cũng đã để cấu hình dir dfs.name: dfs.name.dir /Users/helmut/programmieren/HDFS/tên/ dfs .data.dir và dfs.name.dir sẽ trỏ đến một vị trí trên ổ đĩa ngoài của bạn. Sau khi thay đổi các giá trị này, hãy định dạng lại hệ thống tập tin hdfs của bạn bằng 'hadoop namenode -format' –

+0

Sau khi thực hiện' hadoop namenode -format', bạn cần xoá bất kỳ thứ gì trong dfs.name.dir – Leons

Các vấn đề liên quan