Vì vậy, tôi có một khung dữ liệu với hai yếu tố và một biến số như sau:Xử lý thiếu sự kết hợp của các yếu tố trong R
>D
f1 f2 v1
1 A 23
2 A 45
2 B 27
.
.
.
quá mức f1 là 1 và 2 và mức f2 là A và B. Đây là điều, không có giá trị đầu vào cho khi f1 = 1 và f2 = B (đó là D $ V1 [D $ f1 = 1 & D $ f2 = B] không có) trong thực tế này nên được số không.
Trong khung dữ liệu thực tế, tôi có 11 cấp độ f1 và gần 150 cấp f2 và tôi cần tạo quan sát với v1 = 0 cho mọi kết hợp f1 và f2 bị thiếu trong khung dữ liệu của tôi.
Tôi làm cách nào để thực hiện việc này?
Cảm ơn trước,
Ian
@ user1443010 trong dòng đó, tôi đang sử dụng nó để tránh 'dat $ f1' và' dat $ f2'. Tôi cũng nghĩ rằng nó làm cho ý định rõ ràng; bằng cách sử dụng * đối tượng * này, làm * đó *. Không có gì sai với điều này ở cấp độ người dùng, nhưng có một hình phạt hiệu quả khi R phải tạo ra một môi trường mới với nội dung của đối tượng và cần có thời gian. 'dat2 <- expand.grid (f1 = levels (dat $ f1), f2 = levels (dat $ f2))' sẽ là phương án thay thế. Bạn không thể luôn làm việc với 'with()'; Tôi không nghĩ rằng dòng thay thế 'NA' có thể dễ dàng được chuyển thành một' với() ', nhưng tôi có thể thiếu một cái gì đó. –
tuyệt vời! cảm ơn! ;) – maycca