2009-11-17 28 views
6

Có bất kỳ triển khai mã nguồn mở nào trong số LSI trong Java không? Tôi muốn sử dụng thư viện đó cho dự án của mình. Tôi đã thấy jLSI nhưng nó thực hiện một số mô hình khác của LSI. Tôi muốn có một mô hình chuẩn.Bất kỳ chỉ mục ngữ nghĩa tiềm ẩn nào?

+0

Cảm ơn cho việc thêm các ý kiến ​​về jLSI. – Nettogrof

Trả lời

5

Bạn đã xem LDA (phân bổ gián tiếp Dirichlet) chưa? Tôi đã không thực sự hoặc, nhưng tôi gặp phải vấn đề tương tự với LSI gần đây (bằng sáng chế). Từ những gì tôi hiểu LDA là một kỹ thuật liên quan/mạnh mẽ hơn. http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation dường như có một số liên kết đến triển khai nguồn mở.

+0

Mặc dù bạn đặc biệt yêu cầu LSI không phải là bạn. Ồ, đáng để bắn ... –

1

Tìm kiếm trên Google cho java LSI dẫn đến a similar question đề xuất SemanticVectors. Một gói được xây dựng trên đầu trang của Lucene là 'tương tự' với LSI. Tôi không biết nếu nó gần hơn việc thực hiện jLSI.

Chủ đề đó cũng đề cập rằng LSI được cấp bằng sáng chế và không có nhiều triển khai của nó. Vì vậy, nếu bạn cần một triển khai chuẩn, bạn có thể phải sử dụng một ngôn ngữ khác với java.

0

Tôi tin rằng LSA/LSI đã được cấp bằng sáng chế vào năm 1989, có nghĩa là bằng sáng chế đã hết hạn. Hy vọng rằng chúng ta sẽ sớm thấy một số ứng dụng mã nguồn mở tốt đẹp.

1

S-Space Package có phiên bản nguồn mở của LSA, với các ràng buộc cho vectơ tài liệu LSI. (Cả hai cách tiếp cận hoạt động trên cùng một ma trận thuật ngữ tài liệu và tương đương ngoại trừ trong đầu ra.) Đó là một cách tiếp cận khá khả năng mở rộng sử dụng mỏng-SVD. Tôi đã sử dụng nó để chạy LSI trên tất cả các Wikipedia không có vấn đề (sau khi loại bỏ các điều khoản không thường xuyên với ít hơn 5 lần xuất hiện).

Như Scott Ray đã đề cập, gói SemanticVectors cũng có thực thi LSI tốt mà gần đây đã chuyển sang sử dụng cùng một SVD mỏng (SVDLIBJ), vì vậy bạn có thể kiểm tra xem liệu bạn có làm như trước đây không.

1

một tìm kiếm google cho các công cụ NLP cung cấp slides này mà tôi nghĩ rằng sẽ giúp ...

Các vấn đề liên quan