Tôi không chắc chắn cách xử lý NA
trong Julia DataFrames.Julia DataFrames.jl - lọc dữ liệu với NA (NAException)
Ví dụ với DataFrame sau:
> import DataFrames
> a = [email protected]([1, 2, 3, 4, 5]);
> b = [email protected]([3, 4, 5, 6, NA]);
> ndf = DataFrames.DataFrame(a=a, b=b)
tôi có thể thực hiện thành công các hoạt động sau đây trên cột :a
> ndf[ndf[:a] .== 4, :]
nhưng nếu tôi cố gắng hoạt động tương tự trên :b
tôi nhận được một lỗi NAException("cannot index an array with a DataArray containing NA values")
.
> ndf[ndf[:b] .== 4, :]
NAException("cannot index an array with a DataArray containing NA values")
while loading In[108], in expression starting on line 1
in to_index at /Users/abisen/.julia/v0.3/DataArrays/src/indexing.jl:85
in getindex at /Users/abisen/.julia/v0.3/DataArrays/src/indexing.jl:210
in getindex at /Users/abisen/.julia/v0.3/DataFrames/src/dataframe/dataframe.jl:268
Điều này là do sự có mặt của giá trị NA.
Câu hỏi của tôi là DataFrames với NA
thường nên được xử lý như thế nào? Tôi có thể hiểu rằng hoạt động >
hoặc <
chống lại NA
sẽ là undefined
nhưng ==
sẽ hoạt động (không?).