Tôi đang học cách sử dụng Hadoop Pig ngay bây giờ.Số lượng lợn Hadoop
Nếu tôi có một tập tin đầu vào như thế này:
a,b,c,true
s,c,v,false
a,s,b,true
...
Các trường cuối cùng là người tôi cần phải đếm ... Vì vậy, tôi muốn biết có bao nhiêu 'true' và 'sai' trong tập tin này .
tôi cố gắng:
records = LOAD 'test/input.csv' USING PigStorage(',');
boolean = foreach records generate $3;
groups = group boolean all;
Bây giờ tôi bị mắc kẹt. Tôi muốn sử dụng:
count = foreach groups generate count('true');"
Để có được số lượng "true" nhưng tôi luôn nhận được lỗi:
2013-08-07 16:32:36,677 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1070: Could not resolve count using imports: [, org.apache.pig.builtin., org.apache.pig.impl.builtin.] Details at logfile: /etc/pig/pig_1375911119028.log
Ai có thể cho tôi biết nơi mà vấn đề là gì?
Cảm ơn, nó hoạt động! – user2597504