Đây là một khởi đầu khó khăn cho giải pháp của vấn đề này liên quan đến phân phối đồng đều và tải trọng tối đa.
Thay vì thùng và quả bóng hoặc bình hoặc hộp hoặc xô hoặc m và n, người (p) và cửa ra vào (d) sẽ được sử dụng làm chỉ định.
Có giá trị kỳ vọng chính xác cho mỗi cửa được cung cấp cho một số lượng người nhất định. Ví dụ, với 5 người và 5 cửa, cửa tối đa dự kiến chính xác là 1.2864 {(1429-625)/625} trên giá trị trung bình (p/d) và cửa tối thiểu chính xác là -0,9616 {(24-625)/625 } bên dưới giá trị trung bình. Giá trị tuyệt đối của khoảng cách cửa cao nhất từ trung bình là lớn hơn một chút so với cửa nhỏ nhất bởi vì tất cả mọi người có thể đi qua một cánh cửa, nhưng không ít hơn 0 có thể đi qua một trong những cánh cửa.Với số lượng người lớn (p/d> 3000), sự khác biệt giữa giá trị tuyệt đối của khoảng cách cửa cao nhất từ cửa trung bình và cửa thấp nhất trở nên không đáng kể.
Đối với một số lẻ cửa, cửa trung tâm về cơ bản là không và không thể mở rộng, nhưng tất cả các cửa khác có thể mở rộng từ các giá trị nhất định đại diện cho p = d. Những giá trị làm tròn cho d = 5 là:
-1,163 -0,495 0 * 0,495 1,163 * chầm chậm tiến tới zero từ -0,12
Từ những giá trị này, bạn có thể tính toán số lượng dự kiến của mọi người đối với bất kỳ số lượng người đi qua mỗi 5 cánh cửa, bao gồm cánh cửa tối đa. Ngoại trừ cánh cửa được đặt giữa, sự khác biệt so với giá trị trung bình có thể mở rộng bằng sqrt (p/d).
Vì vậy, đối với p = 50.000 và d = 5:
Số lượng người mong đợi đi qua cửa tối đa, có thể là bất kỳ trong số 5 cửa, = 1.163 * sqrt (p/d) + p/d. = 1.163 * sqrt (10.000) + 10.000 = 10,116.3 Đối với p/d < 3,000, kết quả từ phương trình này phải được tăng nhẹ.
Với nhiều người hơn, cửa giữa từ từ trở nên gần hơn và gần bằng không từ -0.11968 ở p = 100 và d = 5. Nó luôn luôn có thể được làm tròn lên đến số không và giống như 4 cửa khác có khá khác biệt.
Các giá trị trong vòng 6 cửa là: -1,272 -0,643 -0,202 0,202 0,643 1,272
Đối với 1000 cửa ra vào, các giá trị tương đối như sau: -3,25, -2,95, -2,79 ... 2,79, 2,95, 3,25
Đối với bất kỳ d và p nào, có giá trị kỳ vọng chính xác cho mỗi cửa được đặt hàng. Hy vọng rằng, một xấp xỉ tốt (với một lỗi tương đối < 1%) tồn tại. Một số giáo sư hoặc nhà toán học ở đâu đó phải biết.
Để thử nghiệm phân phối đồng đều, bạn sẽ cần một số phiên đặt hàng trung bình (750-1000 hoạt động tốt) thay vì số lượng người nhiều hơn. Không có vấn đề gì, sự chênh lệch giữa các phiên hợp lệ là rất lớn. Đó là bản chất của sự ngẫu nhiên. Va chạm là không thể tránh khỏi. *
Giá trị dự kiến cho 5 và 6 cửa được tính bằng cách tính toán sức mạnh tuyệt đối bằng cách sử dụng số nguyên 640 bit và tính trung bình sự hội tụ của giá trị tuyệt đối của cửa đối diện tương ứng. Ví d = 5 và p = 170: -6,63901 -2,95905 -0,119342 2,81054 6,90686 (27,36099 31,04095 33,880658 36,81054 40,90686) Ví d = 6 và p = 108: -5,19024 -2,7711 -0,973979 0,734434 2,66716 5,53372 (12,80976 15.2289 17.026021 18.734434 20.66716 23.53372)
Tôi hy vọng rằng bạn có thể phân phối đồng đều dữ liệu của mình.
- Nó gần như đảm bảo rằng tất cả các con trai của George Foreman hoặc một số tình huống tương tự sẽ chiến đấu chống lại hàm băm của bạn. Và kế hoạch ngẫu nhiên phù hợp là công việc của tất cả các lập trình viên giỏi.
Cảm ơn nỗ lực của bạn. Với đầu vào ngẫu nhiên 'hoàn toàn' tôi đã tìm kiếm để xác minh hàm băm bằng cách so sánh hiệu suất của nó với một số kết quả lý thuyết. Vì Balls in Bins mang lại xác suất đơn giản cho các giá trị được đo dễ dàng, tôi đã mong đợi để có thể dễ dàng xác minh hàm băm của tôi.Nhưng sau đó các kết quả 'order-of' max-load được trình bày, tuy nhiên cái có '3' trông đầy hứa hẹn - nhưng nó là' log2' hay 'loge' (tôi nghĩ cơ sở e w.h.p :)? – philcolbourn
Có lẽ không thể định lượng được giá trị này, nhưng cách mà bài báo trình bày dường như mang lại hy vọng. Tôi lấy ý tưởng của bạn để vẽ hành vi tải trọng tối đa để xem liệu tôi có nằm trong một yếu tố không đổi hay không, nhưng ngay cả với một bảng lớn có khe 65k nói, tải trọng tối đa w.h.p có thể là 4 - vì vậy yếu tố không đổi là quan trọng. – philcolbourn
Ngoài ra, trong thực tế bạn sẽ không nhằm mục đích điền vào bảng băm có kích thước N với N băm, nhưng điểm thiết lập này dường như cho phép bất kỳ hàm băm nào được kiểm tra sẽ tốt đẹp và giữ các đối số hiệu suất hàm băm trong kiểm tra - đối với tôi, để có thể nói rằng hàm băm hoạt động chính xác đáng giá hơn rất nhiều so với việc ai đó nói rằng "hàm băm này hoạt động tốt cho các chuỗi văn bản dài". – philcolbourn