Ai đó có thể giải thích tại sao tôi nhận được các câu trả lời khác nhau bằng cách sử dụng hàm tổng hợp để đếm các giá trị bị thiếu theo nhóm? Ngoài ra, có cách nào tốt hơn để đếm các giá trị bị thiếu theo nhóm bằng cách sử dụng hàm R gốc không?R đếm NA theo nhóm
DF <- data.frame(YEAR=c(2000,2000,2000,2001,2001,2001,2001,2002,2002,2002), X=c(1,NA,3,NA,NA,NA,7,8,9,10))
DF
aggregate(X ~ YEAR, data=DF, function(x) { sum(is.na(x)) })
with(DF, aggregate(X, list(YEAR), function(x) { sum(is.na(x)) }))
aggregate(X ~ YEAR, data=DF, function(x) { sum(! is.na(x)) })
with(DF, aggregate(X, list(YEAR), function(x) { sum(! is.na(x)) }))