Sử dụng dplyr để tóm tắt tập dữ liệu, tôi muốn gọi n_distinct để đếm số lần xuất hiện duy nhất trong cột. Tuy nhiên, tôi cũng muốn thực hiện một tóm tắt khác() cho tất cả các lần xuất hiện duy nhất trong một cột trong đó một điều kiện trong một cột khác được thỏa mãn.dplyr n_distinct với điều kiện
Ví dụ dataframe tên "a":
A B
1 Y
2 N
3 Y
1 Y
a %>% summarise(count = n_distinct(A))
Tuy nhiên tôi cũng muốn thêm một tội danh n_distinct(A)
nơi B == "Y"
Kết quả sẽ là:
count
3
khi bạn thêm con dition kết quả nên là:
count
2
Kết quả cuối cùng tôi đang cố gắng để đạt được là cả hai câu lệnh sáp nhập vào một cuộc gọi mà mang lại cho tôi một kết quả như
count_all count_BisY
3 2
cách thích hợp để đi về việc này là gì với dplyr?
Bạn có thể thử sử dụng: a%>% tóm tắt (count = n_distinct (A [B == 'Y']))? – Gopala
@ user3949008 Lỗi: Nhập vào n_distinct() phải là một tên biến duy nhất từ tập dữ liệu –
Xin lỗi, tác vụ này n_distinct (df $ A [df $ B == 'Y']). – Gopala