Tôi đang cố xóa các quan sát trùng lặp khỏi tập dữ liệu dựa trên biến, id của tôi. Tuy nhiên, tôi muốn loại bỏ các quan sát dựa trên các quy tắc sau đây. Các biến dưới đây là id, giới tính của chủ hộ (1 nam, 2 nữ) và tuổi của chủ hộ. Luật như sau. Nếu một hộ gia đình có cả chủ hộ nam và nữ, thì hãy bỏ quan sát của chủ hộ nữ. Nếu một hộ gia đình là một trong hai nam hoặc hai đầu nữ, hãy loại bỏ sự quan sát với người chủ hộ trẻ. Một bộ dữ liệu mẫu dưới đây.Xóa các quan sát trùng lặp dựa trên bộ quy tắc
id = c(1,2,2,3,4,5,5,6,7,8,8,9,10)
sex = c(1,1,2,1,2,2,2,1,1,1,1,2,1)
age = c(32,34,54,23,32,56,67,45,51,43,35,80,45)
data = data.frame(cbind(id,sex,age))
Tôi đã suy nghĩ phức tạp hơn. Sử dụng logic đơn giản +1 –
có cùng ý tưởng, nhưng không tìm ra '-age' (+1) – adibender
' id 10' dường như bị thiếu từ đầu ra mặc dù ... – adibender