Tôi muốn thực hiện thao tác DISTINCT trên một tập con của các cột. Các documentation nói điều này là có thể với một forested lồng nhau:Làm thế nào để thực hiện một DISTINCT trong Pig Latin trên một tập con của các cột?
Bạn không thể sử dụng DISTINCT trên một nhóm nhỏ các trường; để làm điều này, sử dụng FOREACH và một khối lồng nhau để chọn các trường đầu tiên và sau đó áp dụng DISTINCT (xem Ví dụ: Khối lồng nhau).
Nó là đơn giản để thực hiện một hoạt động riêng biệt trên tất cả các cột:
A = LOAD 'data' AS (a1,a2,a3,a4);
A_unique = DISTINCT A;
Cho phép nói rằng tôi đang quan tâm trong việc thực hiện khác nhau trên khắp a1, a2, và a3. Bất cứ ai có thể cung cấp một ví dụ cho thấy làm thế nào để thực hiện hoạt động này với một forested lồng nhau như đề xuất trong tài liệu?
Dưới đây là một ví dụ về đầu vào và đầu ra mong đợi:
A = LOAD 'data' AS(a1,a2,a3,a4);
DUMP A;
(1 2 3 4)
(1 2 3 4)
(1 2 3 5)
(1 2 4 4)
-- insert DISTINCT operation on a1,a2,a3 here:
-- ...
DUMP A_unique;
(1 2 3 4)
(1 2 4 4)
Bạn có thể cung cấp đầu vào ví dụ và đầu ra dự kiến không? – zero323
Đề xuất hay, tôi đã cập nhật câu hỏi. – Freerobots