Tôi đang sử dụng PIG để tạo ra các nhóm từ các bộ như sau:PIG: Nhận tất cả các bộ ra khỏi một chiếc túi nhóm
a1, b1
a1, b2
a1, b3
...
->
a1, [b1, b2, b3]
...
này rất dễ dàng và làm việc. Nhưng vấn đề của tôi là để có được những điều sau: Từ các nhóm thu được, tôi muốn tạo ra một tập hợp của tất cả các bản ghi trong túi của nhóm:
a1, [b1, b2, b3]
->
b1,b2
b1,b3
b2,b3
Đây sẽ là dễ dàng nếu tôi có thể làm tổ "foreach" và trước hết lặp trên mỗi nhóm và sau đó trên túi của nó.
Tôi cho rằng tôi hiểu nhầm khái niệm và tôi sẽ đánh giá cao sự giải thích của bạn.
Cảm ơn.
Laurens là đúng. UDF này thực hiện chính xác những gì bạn cần và nó cũng là cách hiệu quả hơn so với một giải pháp dựa trên Pig thuần túy sử dụng sản phẩm Descartes. Nhân tiện, URL đã thay đổi: [UnorderedPairs] (http://datafu.incubator.apache.org/docs/datafu/1.2.0/datafu/pig/bags/UnorderedPairs.html) – matterhayes