2012-06-21 29 views
6

Tôi đang cố gắng thực hiện một cụm "cụm" trên đầu ra của ví dụ về nhóm cụm từ mahout kmeans (ví dụ về synthetic_control). Nhưng tôi đang trải qua những lỗi sau:là có bất kỳ tùy chọn seqFileDir cho "clusterdump" trong thư viện "apache mahout" mới nhất?

> ~/MAHOUT/trunk/bin/mahout clusterdump --seqFileDir clusters-10-final --pointsDir clusteredPoints --output a1.txt 

MAHOUT_LOCAL is not set; adding HADOOP_CONF_DIR to classpath. 
Running on hadoop, using /usr/lib/hadoop/bin/hadoop and HADOOP_CONF_DIR=/usr/lib/hadoop/conf/ 
MAHOUT-JOB: /home/<username>/MAHOUT/trunk/examples/target/mahout-examples-0.8-SNAPSHOT-job.jar 

12/06/21 22:43:18 WARN conf.Configuration: DEPRECATED: hadoop-site.xml found in the classpath. Usage of hadoop-site.xml is deprecated. Instead use core-site.xml, mapred-site.xml and hdfs-site.xml to override properties of core-default.xml, mapred-default.xml and hdfs-default.xml respectively 

12/06/21 22:43:25 ERROR common.AbstractJob: Unexpected --seqFileDir while processing Job-Specific Options: 
usage: <command> [Generic Options] [Job-Specific Options] 
..... 

Vì vậy, tôi đoán không có "seqFileDir" tùy chọn cho clusterdump nhưng tất cả các hướng dẫn trực tuyến (ví dụ https://cwiki.apache.org/MAHOUT/cluster-dumper.html) tham khảo tùy chọn này. Bạn có thể gợi ý cho tôi biện pháp khắc phục hoặc những gì tôi đang thiếu không?

Trả lời

2

Bạn đã cố gắng chỉ định nó làm tùy chọn --input?

+1

vâng tôi đã làm. Khi tôi thay thế --seqFileDir bởi --input, một tệp đầu ra được tạo ra , nhưng đó là EMPTY! Bạn có biết tại sao các hướng dẫn nói về tùy chọn --seqFileDir không? –

+2

Tôi đã làm việc về vấn đề này. Một cách kỳ diệu tôi đã tìm ra giải pháp !!! Cảm ơn đề xuất của bạn - đầu ra đã làm việc tại tùy chọn --seqFileDir. Những gì tôi đã làm sai là, tôi đã không nhận ra clusterdump (với bộ HADOOP_HOME) đọc từ HDFS và viết đầu ra cho hệ thống tập tin địa phương. Dù sao, mọi thứ đang hoạt động tốt ngay bây giờ! –

Các vấn đề liên quan