2012-11-27 41 views
8

Tôi đã có một khung dữ liệu đáng yêu, đầu tiên của tôi, và tôi bắt đầu để có được hang của R. Một điều tôi đã không thể tìm thấy là một thử nghiệm cho các giá trị trùng lặp. Tôi có một cột mà tôi chắc chắn là tất cả các giá trị duy nhất, nhưng tôi không biết điều đó.Tìm hiểu xem cột trong bảng R có bao gồm các giá trị trùng lặp không?

Có cách nào tôi có thể hỏi không? Để đơn giản, chúng ta hãy giả vờ đây là dữ liệu của tôi:

var1 var2 var3 
1 1 A 1 
2 2 B 3 
3 3 C NA 
4 4 D NA 
5 5 E 4 

và tôi muốn biết liệu var1 bao giờ lặp lại.

Trả lời

10

Kiểm tra các duplicated chức năng:

duplicated(dat$var1) # the rows of dat var1 duplicated 

Documentation là here.

Bạn cũng nên xem xét chức năng unique.

+3

Tài liệu cũng đề cập đến 'anyDuplicated' có thể liên quan trực tiếp hơn. – joran

+0

@Joran nó phải được chỉ ra rằng 'bất kỳ (trùng lặp (dat $ var1))' sẽ cung cấp cho một giá trị T/F, nơi như 'anyDuplicated (dat $ var1)' sẽ cung cấp cho một chỉ số/0 giá trị. –

+0

anyDuplicated it is. Vì vậy, bây giờ nó chỉ ra rằng 'anyDuplicated (j)' trả về 2039, đó là chính xác những gì 'anyDuplicated (j $ should_be_unique)' trả về. Đây là trong số 81.000 bản ghi. Tôi có thể tạo ra một đối tượng ma trận là TRUE/FALSE nhưng không thể kiểm tra xem cái nào là 2039. Câu hỏi mới? – Amanda

Các vấn đề liên quan