Tôi cần trợ giúp về tập lệnh lợn này. Tôi chỉ nhận được một kỷ lục duy nhất. Tôi đang chọn 2 cột và thực hiện đếm (khác biệt) trên một cột khác trong khi cũng sử dụng mệnh đề tương tự để tìm mô tả cụ thể (desc).chọn số khác biệt bằng cách sử dụng lợn latin
Đây là sql của tôi với lợn Tôi đang cố gắng viết mã.
/*
For example in sql:
select domain, count(distinct(segment)) as segment_cnt
from table
where desc='ABC123'
group by domain
order by segment_count desc;
*/
A = LOAD 'myoutputfile' USING PigStorage('\u0005')
AS (
domain:chararray,
segment:chararray,
desc:chararray
);
B = filter A by (desc=='ABC123');
C = foreach B generate domain, segment;
D = DISTINCT C;
E = group D all;
F = foreach E generate group, COUNT(D) as segment_cnt;
G = order F by segment_cnt DESC;
Tôi nghĩ là hoàn hảo nên là unique_segments = DISTINCT C.segment; –