2009-06-30 26 views
27

Có ai biết liệu có tồn tại không?Máy phân tích Lucene Hebrew

Tôi đã googling này cho monthes ...

Cảm ơn

+0

Đã đến lúc cộng đồng nguồn mở tạo một cộng đồng. Dường như với tôi rằng sự thật xuất phát là _very_ khó khăn, đến mức đòi hỏi một lượng lớn nhân lực, nhưng một số cơ bản có thể xuất phát, và có lẽ một thân cây nhỏ nhất là tốt hơn không xuất phát. Có lẽ tôi sẽ bắt đầu tự mình làm việc này. Nếu có ai quan tâm, hãy liên hệ với tôi. –

+0

... Và như một bước đầu tiên, tôi sẽ cố gắng sử dụng liệt kê hspell (3). Nó có hiệu quả là một gốc đã sẵn sàng! –

Trả lời

21

Cập nhật
HebMorph

Ra khỏi tò mò gây ra bởi câu hỏi của bạn, tôi đã liên lạc với Itamar Syn-Hershko người được hoạt động trên danh sách gửi thư của Lucene khoảng một năm trước đây khi ông đang làm việc trên một máy phân tích tiếng Do Thái cho Lucene. Tôi hỏi anh ta liệu anh ta đã hoàn thành máy phân tích của mình chưa. Dưới đây là một số bit có liên quan từ phản hồi của anh ấy:

Để tạo một câu chuyện dài, không, tôi không. Không có phân tích tiếng Do Thái miễn phí/ mã nguồn mở cho Lucene, mà tôi có thể nói chắc chắn. Tôi là không chắc chắn nền của bạn là gì trên chủ đề, nhưng hãy tin tôi khi tôi nói không có cách nào dễ dàng để thực hiện việc này; nó cũng có thể là Lucene không được xây dựng cho tìm kiếm tiếng Do Thái, nhưng tôi đồng ý một giải pháp phải được đưa ra. Cấp, cách an toàn nhất để lập chỉ mục và tìm kiếm các văn bản tiếng Do Thái là sử dụng trình chặn chuyên dụng, và tích hợp với Lucene không phải là dễ nhất ngay cả sau khi bạn đã thực hiện việc này. Có một vài giải pháp rất tốt để tìm kiếm tiếng Do Thái trên thị trường, chỉ mà tôi biết đang sử dụng Lucene trong đó là cốt lõi; Tôi vừa mới cố gắng liên lạc với họ, không có phản ứng chưa ...

Các sản phẩm thương mại dựa trên Lucene được đề cập được gọi là ATTIVIO và the ATTIVIO website không yêu cầu phải có hỗ trợ tiếng Hebrew. Tại số SIGTRS (Hebrew Text Retrieval interest group), đã có một số số discussion regarding ATTIVIO xác nhận rằng đó là Lucene.

Vì vậy, rõ ràng, có thể tạo ra một bộ phân tích tiếng Do Thái phong nha cho Lucene, nhưng không có bộ phân tích miễn phí nào có sẵn tại thời điểm này.

+0

Wow, cảm ơn cả một nhóm! – Roey

+0

Không sao cả; vui vì nó rất hữu ích. ;) – Naaff

+4

Xin chào, tôi cuối cùng đã có thời gian để bắt đầu làm việc trên một, và cho đến nay có vẻ đầy hứa hẹn. Xem: http://www.code972.com/blog/hebmorph/. Itamar. – synhershko

0

dtsearch có một cú pháp gọi là "pensim". Nó dường như được phát triển bởi "wizcomtech.com".

Các vấn đề liên quan