Trông giống như một vấn đề ngớ ngẩn, nhưng tôi không thể tìm cách lọc các giá trị null từ các hàng của tôi. Đây là kết quả khi tôi đổ đối tượng GeoInfo:Lọc các giá trị null bằng pig
DUMP geoinfo;
([longitude#70.95853,latitude#30.9773])
([longitude#-9.37944507,latitude#38.91780853])
(null)
(null)
(null)
([longitude#-92.64416,latitude#16.73326])
(null)
(null)
([longitude#-9.15199849,latitude#38.71179122])
([longitude#-9.15210796,latitude#38.71195131])
đây là mô tả
DESCRIBE geoinfo;
geoinfo: {geoLocation: bytearray}
Những gì tôi đang cố gắng làm là để lọc các giá trị null như thế này:
geoinfo_no_nulls = FILTER geoinfo BY geoLocation is not null;
nhưng kết quả vẫn giữ nguyên. không có gì được lọc.
Tôi cũng đã cố gắng một cái gì đó như thế này
geoinfo_no_nulls = FILTER geoinfo BY geoLocation != 'null';
và tôi đã nhận ra lỗi
org.apache.pig.backend.executionengine.ExecException: ERROR 1071: Cannot convert a map to a String
Tôi đang làm gì sai?
chi tiết, chạy trên ubuntu, hadoop-1.0.3 với lợn 0.9.3
lợn -version Apache Pig phiên bản 0.9.3-SNAPSHOT (rexported) biên soạn 24 tháng 10 năm 2012, 19:04:03
java phiên bản "1.6.0_24" OpenJDK Runtime Environment (IcedTea6 1.11.4) (6b24-1.11.4-1ubuntu0.12.04.1) OpenJDK 64-Bit server VM (xây dựng 20,0-b12, chế độ hỗn hợp)
Hãy gửi kịch bản hoàn chỉnh của bạn. –