Tôi có một khung dữ liệu gồm 9 cột bao gồm một danh sách các yếu tố. Mỗi hàng có thể có tất cả 9 cột được điền (như trong hàng đó đang giữ 9 "thứ"), nhưng hầu hết không (hầu hết đều có từ 3-4). Các cột không cụ thể, như trong mục 200 xuất hiện trong cột 1 và 3, nó cũng giống nhau. Tôi muốn tạo một ma trận là nhị phân cho mỗi hàng bao gồm tất cả các yếu tố.Cách tạo ma trận nhị phân của khoảng không quảng cáo trên mỗi hàng? (R)
Ex (rút ngắn xuống còn 4 cột chỉ để có được chỉ qua)
R1 3 4 5 8
R2 4 6 7 NA
R3 1 5 NA NA
R4 2 6 8 9
nên biến thành
1 2 3 4 5 6 7 8 9
r1 0 0 1 1 1 0 0 1 0
r2 0 0 0 1 0 1 1 0 0
r3 1 0 0 0 1 0 0 0 0
r4 0 1 0 0 0 1 0 1 1
Tôi đã nhìn vào writeBin/readBin, K-clustering (đó là điều mà tôi muốn làm, nhưng tôi cần phải loại bỏ các NA trước), phân cụm mờ, phân cụm từ khóa. Chỉ cần kinda bị mất về những gì hướng đi.
Tôi đã thử viết hai cho các vòng kéo dữ liệu từ ma trận theo cột/hàng và sau đó lưu 0 và 1 tương ứng vào ma trận mới, nhưng tôi nghĩ có vấn đề về phạm vi.
Các bạn là người giỏi nhất. Cảm ơn!
+1 Bit cbind đó thổi tâm trí của tôi. –
Josh, điều này thật ấn tượng. Có một thuật ngữ cho những gì được gọi là? Tôi đã suy nghĩ ma trận hàng tồn kho, ma trận mục, hoặc ma trận nhị phân, nhưng tất cả dường như liên quan đến các ý tưởng khác. –
Cảm ơn. Tôi nghĩ * kết quả là ma trận chỉ thị (sau hàm [chỉ báo] (http://en.wikipedia.org/wiki/Indicator_function)) của ma trận hiện diện/vắng mặt (vì nó mã hóa có hay không mỗi mục có mặt hoặc vắng mặt trong một hàng nhất định). Tuy nhiên, không chắc chắn nếu có một tên chung được chấp nhận cho nó. –