Tôi đang tìm thư viện Java gọn nhẹ hỗ trợ Tìm kiếm lân cận gần nhất bằng tính năng Phân tích nhạy cảm cục bộ cho dữ liệu được phân phối gần như trong bộ dữ liệu chiều cao (trong trường hợp của tôi 32) với hàng trăm nghìn điểm dữ liệu.Thư viện LSH trong Java
Hoàn toàn đủ tốt để nhận tất cả các mục nhập trong một nhóm cho truy vấn. Mà những người tôi thực sự cần sau đó có thể được xử lý theo một cách khác nhau đang xem xét một số thông số bộ lọc vấn đề của tôi bao gồm.
Tôi đã tìm thấy likelike nhưng hy vọng rằng có gì đó nhỏ hơn một chút và không cần bất kỳ công cụ nào khác (như Apache Hadoop trong trường hợp tương tự).
Bạn đã tìm thấy bất cứ điều gì? Tôi đã tìm kiếm cùng với khoảng cách Euclide như số liệu của tôi cho kNN. –
Không thực sự. Nhưng tôi nghĩ tôi sẽ phải tự mình thực hiện. Tuy nhiên, câu hỏi vẫn là cách chọn hàm băm tốt ... – s1lence
Bạn có thể bắt đầu với hàm băm trong triển khai MATLAB tại http://ttic.uchicago.edu/~gregory/download.html –