Tôi có một khung dữ liệu với> 100 cột và tôi sẽ tìm các hàng duy nhất bằng cách chỉ so sánh hai cột. Tôi hy vọng đây là một cách dễ dàng, nhưng tôi không thể làm cho nó hoạt động với chính mình unique
hoặc duplicated
.Độc đáo trên một khung dữ liệu chỉ với các cột được chọn
Trong dưới đây, tôi muốn duy nhất chỉ sử dụng id và id2:
data.frame(id=c(1,1,3),id2=c(1,1,4),somevalue=c("x","y","z"))
id id2 somevalue
1 1 x
1 1 y
3 4 z
Tôi muốn để có được một trong hai:
id id2 somevalue
1 1 x
3 4 z
hay:
id id2 somevalue
1 1 y
3 4 z
(Tôi không có tùy chọn nào trong số các hàng duy nhất được lưu giữ)
đầu ra mong muốn của bạn không được xác định rõ. Làm thế nào để bạn chọn để bao gồm x nhưng không phải y? Quyết định này sẽ cần phải được thực hiện cho mỗi cột của mỗi hàng lặp đi lặp lại, và bạn đã không đưa ra chỉ dẫn về cách thực hiện nó. – joran
Tôi không có sở thích cho dù 'x' hoặc 'y' được bao gồm. Tôi sẽ cập nhật câu hỏi. – Ina