Tôi có hai khung dữ liệu:Đếm phù hợp giữa hai chuỗi
df.1 <- data.frame(loc = c('A','B','C','C'), person = c(1,2,3,4), str = c("door/window/table", "window/table/toilet/vase ", "TV/remote/phone/window", "book/vase/car/chair"))
Như vậy,
loc person str
1 A 1 door/window/table
2 B 2 window/table/toilet/vase
3 C 3 TV/remote/phone/window
4 C 4 book/vase/car/chair
Và,
df.2 <- data.frame(loc = c('A','B','C'), str = c("book/chair/chair", " table/remote/vase ", "window"))
mang đến cho,
loc str
1 A book/chair/car
2 B table/remote/vase
3 C window
Tôi muốn tạo ra một biến df.1$percentage
cho phép tính tỷ lệ phần trăm của các nguyên tố trong df.1$str
có trong df.2$str
chỉnh sửa bởi loc, hay:
loc person str percentage
1 A 1 door/window/table 0.00
2 B 2 window/table/toilet/vase 0.50
3 C 3 TV/remote/phone/window 0.25
4 C 4 book/vase/car/chair 0.00
(1
có 0/3, 2
có 2/4 trận đấu, 3
có 1/4 và 4
có 0/4)
Cảm ơn!
Các yếu tố phù hợp có cần cùng một loc không? – Edward
Xin lỗi, vâng. kết hợp các chuỗi bằng 'loc'. Tôi đã chỉnh sửa câu hỏi. – Lucarno