2012-04-14 17 views
6

Có dự án nào giúp thiết lập cụm Hadoop trên máy tính để bàn văn phòng khi chúng không hoạt động?chạy phần mềm Hadoop trên máy tính văn phòng (khi chúng rảnh)

Tôi muốn thử nghiệm với Hadoop/MR/hbase nhưng không có acces đến 5-10 máy tính. Các máy tính tại nơi làm việc không hoạt động sau giờ làm việc và được kết nối với nhau thông qua kết nối tốc độ rất cao. Hơn nữa, dữ liệu trên các máy tính này nằm trong mạng của chúng tôi nên không có vấn đề về quyền riêng tư.

Để làm việc này, tôi cần một màn hình cân khá nhẹ chạy trên mỗi máy. Khi máy tính không hoạt động trong X giờ, máy tính sẽ tham gia vào cụm. Nếu người dùng đăng nhập, nó phải thả ra khỏi cụm và trả lại tất cả CPU/bộ nhớ.

Có điều gì như thế này không?

+0

tôi khuyên bạn nên Amazon AWS/đàn hồi Bản đồ Giảm. Bạn có thể thiết lập các cụm Hadoop khá mạnh mẽ một cách nhanh chóng. – Suman

Trả lời

3

Bạn có thể sử dụng công cụ lập lịch nhiệm vụ để phát hiện trạng thái không hoạt động và sau đó bắt đầu/dừng một voop hadoop với hộp ảo hoặc vmplayer. Hoặc bạn có thể viết một kịch bản PowerShell bắt đầu dừng dựa trên việc sử dụng tài nguyên.

+0

Chà, tôi không có ý tưởng về lịch trình cửa sổ có thể lên lịch liên quan đến thời gian rảnh rỗi! Những người khác ma thấy điều này hữu ích: http://www.microsoft.com/resources/documentation/windows/xp/all/proddocs/en-us/agent_idle_time.mspx?mfr=true – Shahbaz

+0

Chúng tôi có bất kỳ tham chiếu hoặc liên kết nào mà chúng tôi có thể thiết lập và sử dụng hộp ảo trong mỗi Máy tính để bàn có 4 Gigs RAM và thiết lập Hadoop Cluster. Nó sẽ là một phòng thí nghiệm thực nghiệm tốt. Bất kỳ suy nghĩ hay ý tưởng nào? –

1

Hadoop không phải là lưới tính toán nó là một mạng lưới dữ liệu hơn (xem trang 9 trong this presentation). Vấn đề là với hadoop rằng dữ liệu được lan truyền trên cụm và do đó dữ liệu phải được lưu trữ trên các máy tính. Thời gian cần để sao chép dữ liệu trên/xóa dữ liệu khi chúng không hoạt động có thể không đáng giá - bạn nên sử dụng hadoop trong đám mây (amazon, Azure, v.v.)

+0

Tôi sẽ không xóa dữ liệu. Tắt một nút khi máy tính đang được sử dụng bởi một con người chỉ có nghĩa là tôi sẽ tạm thời loại bỏ các nút từ cụm hadoop. Khi máy tính có sẵn cho hadoop, nút sẽ khởi động và nối lại cụm. – Shahbaz

0

Nhìn vào các giải pháp như NEREUS mà là một giải pháp MPC tốt trong Java

+0

Cảm ơn Grooveek. Tôi đã có một giải pháp tương tự tại trường đại học của tôi (greedy.epfl.ch). Những gì tôi đang tìm kiếm là triển khai Hadoop. – Renaud

1

tôi sẽ sử dụng một cái gì đó giống như Condor: http://research.cs.wisc.edu/condor/

+0

Cảm ơn HaloWebMaster. Tôi đã có một giải pháp Condor tại trường đại học của tôi (greedy.epfl.ch). Thật tuyệt vời, nhưng tôi muốn sử dụng một cái gì đó như HDFS, vì vậy tôi đang tìm kiếm là một triển khai Hadoop. – Renaud

+0

Có thể bạn có thể sử dụng [Hệ thống tệp vẹt ảo] (http://ccl.cse.nd.edu/software/parrot/) trong các công việc của Condor. – mhucka

1

Bạn có thể muốn xem xét dự án Mặt trăng Virginia Tech http://www.wired.com/wiredenterprise/2012/05/project_moon/

+0

Hệ thống của họ có sẵn bên ngoài Virginia Tech không? Tôi không thể tìm thấy liên kết để tải xuống ... – Renaud

+0

Renaud, bạn có thể muốn liên hệ với Lead PI của Dự án Moon Wu-Chun Feng http://people.cs.vt.edu/~feng/ để kiểm tra xem liệu nó có sẵn hay không để tải xuống – fjxx

Các vấn đề liên quan