Đây phải là một bản sao nhưng tôi không thể tìm thấy nó. Vì vậy, ở đây đi.khớp/tìm các hàng dựa trên nhiều giá trị bắt buộc trong một hàng duy nhất trong R
Tôi có một data.frame có hai cột. Một chứa một nhóm và nhóm còn lại chứa một tiêu chí. Một nhóm có thể chứa nhiều tiêu chí khác nhau, nhưng chỉ có một tiêu chí cho mỗi hàng. Tôi muốn xác định các nhóm có chứa ba tiêu chí cụ thể (nhưng điều đó sẽ xuất hiện trên các hàng khác nhau. Trong trường hợp của tôi, tôi muốn xác định tất cả các nhóm có chứa tiêu chí "I", "E", "C". và sự kết hợp của những điều này và nhiều thư khác.
test <- data.frame(grp=c(1,1,2,2,2,3,3,3,4,4,4,4,4),val=c("C","I","E","I","C","E","I","A","C","I","E","E","A"))
> test
grp val
1 1 C
2 1 I
3 2 E
4 2 I
5 2 C
6 3 E
7 3 I
8 3 A
9 4 C
10 4 I
11 4 E
12 4 E
13 4 A
trong ví dụ trên, tôi muốn xác định grp 2, và 4 vì mỗi người trong các chứa các chữ E, I, và C.
Cảm ơn!
Tôi cho rằng ba duy nhất() các cuộc gọi trong cùng là khá dư thừa và không cần thiết. Tập dữ liệu thực tế của tôi là vài triệu hàng và tôi không chắc liệu nó có nhanh hơn theo cách đó hay không. – Jordan
Vấn đề thú vị! Nó được gọi là ** và/hoặc tiến thoái lưỡng nan truy vấn ** trong bối cảnh cơ sở dữ liệu SQL vì ràng buộc ** và ** yêu cầu ràng buộc trên nhiều hàng (không phải là độ mạnh của SQL). Tôi háo hức được thấy một giải pháp R (tốt hơn)! –
Có bao nhiêu 'val' duy nhất có trong tập dữ liệu của bạn? Tùy thuộc vào số lượng, thông tin đó có thể hướng dẫn một số giải pháp. – JasonAizkalns