Tôi đang tìm kiếm một số trợ giúp về SQL thiên tài với một vấn đề thống kê phức tạp mà tôi đang gặp phải.Lấy mẫu thống kê SQL
Điều tôi đang làm là kéo mẫu cân bằng thống kê ra khỏi nhóm hồ sơ người dùng không cân bằng. Làm điều này cho một thuộc tính tiểu sử (ví dụ: giới tính) tại một thời điểm sẽ hơi đơn giản. Nhưng làm nó qua nhiều chiều cùng một lúc đòi hỏi một số tinh tế.
Vì lợi ích của đối số, giả sử tôi có bảng này.
Profile.userID
Profile.Gender
Profile.Age
Profile.Income
Nếu tôi muốn kéo một vũng hồ sơ ra khỏi hỗn hợp để lấy mẫu mới của người sử dụng xấp xỉ phù hợp với tất cả các đặc điểm sau:
50% male, 50% female
30% young, 40% middle age, 40% old
40% low income, 40% middle income, 20% high income
Có ai có bất kỳ ý tưởng về làm thế nào để kéo nó xuống?
Điều gì ngăn cản bạn rút ngẫu nhiên từng bản ghi cho đến khi bộ mẫu đáp ứng các đặc điểm của bạn? –
Làm cách nào để giữ liên tục không còn cân bằng? Nói rằng tôi chỉ cần một bản ghi nữ nữa, nhưng kéo cái đó sau đó nghiêng tuổi và thu nhập của tôi ra khỏi sự cân bằng ...? – tbacos
30% trẻ, 40% tuổi trung niên, 40%! = 100% Có sự chồng chéo giữa trẻ trung và trung niên trong phạm vi của bạn không? –