2010-09-01 36 views
9

Gần đây, tôi đã đọc rất nhiều về MapReduce/Hadoop và nghĩ rằng đây là nơi mà ngành công nghiệp hiện đang chuyển đến. Tôi muốn bắt đầu học MapReduce/Hadoop và tôi nghĩ cách tốt nhất để bắt đầu sẽ là triển khai một số dự án nhỏ. Tuy nhiên, tôi đã cố gắng để làm một số googling, nhưng couldnt tìm thấy bất cứ điều gì.Bắt đầu với MapReduce/Hadoop

Các bạn có thể cho tôi một số liên kết hoặc có thể là một số cuốn sách có thể cho tôi giới thiệu thực tế về công nghệ này không. Có thể là một dự án nhỏ mà tôi có thể thực hiện một mình để hiểu rõ hơn về công nghệ.

Cảm ơn, Chander

Trả lời

3

Các ví dụ phổ biến nhất mà có được ném xung quanh đang tạo một chỉ số đảo ngược, và thực hiện grep.

Nếu bạn đang tìm kiếm thêm thông tin:

Một giới thiệu thực sự thân thiện có thể được tìm thấy here. Các giấy ban đầu là here.

Và những gì trông giống như một số mã ví dụ tốt để giúp bạn có được sẽ là here.

+0

Xin lỗi nhưng liên kết bị phá vỡ vì một lý do. Bạn có thể sửa nó không? – Nabin

+0

Liên kết hoạt động với giấy MapReduce gốc: http://research.google.com/archive/mapreduce.html – maxteneff

1

Tôi cũng sẽ đề xuất một số cách tiếp cận học tập thay thế như video và bài giảng. Giống như trên YouTube: (Bạn có thể làm theo từ này để một số chi tiết)

5

Cloudera (phát hành một bản phân phối Hadoop) có một số video đào tạo trực tuyến tuyệt vời cũng như một máy ảo với tất cả mọi thứ thiết lập và có thể chạy qua các ví dụ từ đào tạo miễn phí trực tuyến http://www.cloudera.com/resources/?type=Training

2

Here là một số bài viết/video/hướng dẫn hay về bắt đầu với MapReduce.

2

Cố gắng nhảy dù trên Hadoop mà không hiểu MapReduce có thể gây đau đớn. Tôi nghĩ cách dễ nhất để hiểu búa là nhìn thấy một cái đinh. :) Tôi đã viết một bài viết trên blog (Intro to Parallel Processing with MapReduce) nơi tôi mô tả một vấn đề phổ biến và hiển thị cách giải quyết nó có và không có MapReduce. Sau đó, tôi tiếp tục cho thấy cách MapReduce làm cho nó đơn giản để phân phối tác phẩm trên một cụm.