2010-04-29 25 views
5

Tôi đang cố gắng sử dụng Mahout trong một ứng dụng đang chạy trên Windows. Tôi muốn xây dựng các cụm từ một chỉ số lucene bằng cách sử dụng k-means. Ngay sau khi tôi phải tạo các tệp chuỗi (tạo các vectơ từ một chỉ mục lucene), tôi nhận được một Hadoop-Exception, vì Hadoop thực hiện các lệnh gọi tới các chương trình không xác định trong môi trường Windows (ví dụ chmod). Chạy trong Cygwin không phải là một tùy chọn, vì tôi muốn có thể chạy ứng dụng từ nhật thực.Cách sử dụng Mahout trong môi trường Windows?

Vì vậy, câu hỏi của tôi là

  • có cách nào để tránh phải tạo các tệp chuỗi để truy xuất vectơ của tôi từ chỉ mục lucene không?
  • hoặc có cách nào để tạo tệp chuỗi trong môi trường Windows không?
  • Trả lời

    4

    Cách duy nhất bạn có thể chạy Hadoop trên môi trường Windows là cài đặt Cygwin. Mọi chi tiết, xem bài đăng blog này:

    http://hayesdavis.net/2008/06/14/running-hadoop-on-windows/

    Cygwin sẽ cung cấp tất cả các tiện ích dòng lệnh (như chmod) rằng Hadoop dựa vào. Bạn vẫn có thể chạy các công việc Hadoop của bạn từ bên trong Eclipse nếu bạn muốn.

    +0

    Thứ hai, đây là câu hỏi về Hadoop và bạn không thể chạy Hadoop trên Windows. –

    +0

    HDInsight là một triển khai Hadoop cho Windows Azure. Nếu bạn muốn sử dụng nó trên máy cục bộ của bạn chứ không phải trên đám mây, hãy thử sử dụng trình mô phỏng HDInsight, mà bạn có thể cài đặt với Trình cài đặt Nền tảng Web. – user888734

    +0

    Bạn có thể muốn cập nhật câu trả lời của mình vì giờ đây bạn có thể sử dụng Hadop với Windows (https://wiki.apache.org/hadoop/Hadoop2OnWindows). Tôi sẵn sàng trả lời, nhưng tôi vẫn đang tìm cách sử dụng Mahout :) – fxm

    1

    Bạn có biết API SequenceFile không? Hãy xem tại đây: http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/io/SequenceFile.html Bạn có thể tự mình viết/đọc dữ liệu.

    Tôi nghĩ bạn có thể chạy Mahout từ nhật thực trong Windown ở chế độ độc lập. Nhưng bạn sẽ xuất hiện một số comings ngắn và rào cản. Bạn nên thử cách xa bạn đến.

    Theo tôi, bạn không nên nhấn mạnh vào việc chạy mahout từ nhật thực. ;-)

    0

    Bạn có thể sử dụng máy ảo để chạy môi trường Hadoop của mình. Đối với tôi, giải pháp tốt nhất là sử dụng dự án http://hortonworks.com/. Mọi thứ hoạt động khá tốt.

    Các vấn đề liên quan