Với df:Cách nào tốt hơn để có bảng tần số cho dữ liệu liên tục (R)?
df <- data.frame(value=abs(rnorm(100, 25, 5)), status=sample(0:1,100,replace=T))
df$value[sample(1:100,5)] <- NA
tôi cần để có được một (tỷ lệ phần trăm) Bảng tần số (trở lại tốt hơn một ma trận) như sau:
value | status(0) status(1)
----------------------------
<=25 | 23 (23%) 20 (20%)
>25 | 27 (27%) 25 (25%)
NA | 3 (3%) 2 (2%)
tôi có thể làm điều này bằng:
br <- seq(0, 50, 25)
with(df, summary(cut(value[status==0], br, labels=br[-1],
include.lowest=T, ordered_result=T)))
with(df, summary(cut(value[status==1], br, labels=br[-1],
include.lowest=T, ordered_result=T)))
Nhưng có cách nào để trả lại ma trận như trên không? Cảm ơn!
Và nếu bạn không muốn chỉ định các điểm cắt trái và phải, hãy đặt 'breaks = c (-Inf, 25, Inf)'. –
Mẹo hay. Tôi luôn quên điều đó. –
Cảm ơn! Nên biết bảng() tốt hơn. :) – Rock