Tôi đang sử dụng trình phân tích quả cầu tuyết để chặn các tiêu đề của nhiều tài liệu. Tất cả mọi thứ hoạt động tốt, nhưng họ là một số quirks.Sử dụng kết hợp các ký tự đại diện và thân cây
Ví dụ:
Tìm kiếm "valv", "van" hoặc "van" trả về cùng một số kết quả. Điều này có ý nghĩa vì phân tích quả cầu tuyết làm giảm mọi thứ xuống "valv".
Tôi gặp sự cố khi sử dụng ký tự đại diện. Tìm kiếm "van *" hoặc "van *" không trả lại bất kỳ kết quả nào. Tìm kiếm "valv *" hoạt động như mong đợi.
Tôi hiểu tại sao điều này xảy ra, nhưng tôi không biết cách khắc phục.
Tôi đã nghĩ đến việc viết một trình phân tích lưu trữ các mã thông báo gốc và không có gốc. Về cơ bản áp dụng hai máy phân tích và kết hợp hai luồng mã thông báo. Nhưng tôi không chắc đây có phải là giải pháp thực tế hay không.
Tôi cũng đã nghĩ về việc sử dụng AnalyzingQueryParser, nhưng tôi không biết cách áp dụng điều này cho truy vấn đa năng. Ngoài ra, việc sử dụng AnalyzingQueryParser sẽ trả về kết quả cho "van" khi tìm kiếm "van *" và đó không phải là hành vi mong đợi.
Có cách nào "ưa thích" sử dụng cả hai ký tự đại diện và thuật toán bắt nguồn không?
+1 cho giải pháp thứ hai, đó là cách tự nhiên nhất để làm điều này. –