2012-11-12 31 views

Trả lời

3

Câu trả lời ngắn gọn là không.

Các tsearch2 sử dụng từ điển để bình thường hóa các văn bản:

12.6. Dictionaries

Từ điển được sử dụng để loại bỏ những từ mà không nên được coi trong một tìm kiếm (dừng từ), và bình thường hóa từ để khác nhau các hình thức có nguồn gốc từ cùng một từ sẽ khớp. Một từ được chuẩn hóa thành công được gọi là từ vựng.

và làm thế nào các từ điển được sử dụng Parsing and Lexing

+0

Sau đó, tôi sẽ văn bản xử lý trước và chữ thay lời ngắn với X. Sau đó, tôi có thể xác định X, XX, XXX ... là từ dừng. Vị trí sẽ được preserverd và từ ngắn sẽ không được lập chỉ mục. –

Các vấn đề liên quan