Theo số Hadoop : The Definitive Guide.Làm cách nào để lấy dữ liệu trong các chức năng Map/Reduce?
API mới hỗ trợ cả kiểu "đẩy" và kiểu kéo "lặp". Trong cả hai API, các cặp bản ghi giá trị khóa được đẩy tới trình ánh xạ, nhưng ngoài ra, API mới cho phép người lập bản đồ lấy các bản ghi từ bên trong phương thức map(). Cũng vậy với bộ giảm tốc. Một ví dụ về cách phong cách "kéo" có thể hữu ích là xử lý các bản ghi theo lô, chứ không phải từng cái một.
Có ai đã lấy dữ liệu trong các chức năng Map/Reduce không? Tôi quan tâm đến API hoặc ví dụ cho tương tự.
Tôi nghĩ kịch bản này sẽ hữu ích khi việc xử lý khóa/giá trị hiện tại của bạn sẽ phụ thuộc vào cặp khóa trị giá tiếp theo. –
Nó có thể đã được thực hiện với API cũ và mới. Tuy nhiên, thách thức là xử lý tình huống khi dữ liệu được lan truyền qua các khối. –
Làm thế nào bạn có thể làm điều đó với api cũ? –