2010-02-23 23 views
7

Tôi hiện đang cố gắng phát triển tìm kiếm toàn văn bản cơ bản cho trang web của mình và tôi nhận thấy rằng một số từ như "liên quan" được liệt kê là các từ dừng cho tìm kiếm toàn văn MySQL. Điều này không làm phiền tôi quá nhiều ngay bây giờ vì mọi người tìm kiếm một mục tin tức nhất định sẽ không nhất thiết phải tìm kiếm bằng cách sử dụng từ "liên quan" (nhưng tôi chắc chắn không thể nói cho tất cả mọi người!). Tuy nhiên, tôi đã hy vọng một ai đó ở đây có thể khai sáng cho tôi về lý do để có danh sách từ dừng. Cảm ơn!MySQL Fulltext Stopwords Rationale

Để làm rõ: Tôi đang sử dụng MyIsam cho bảng toàn văn của mình. Các từ dừng là những từ mà MySQL sẽ không lập chỉ mục (đối với bất kỳ chỉ mục toàn văn nào). Như đã lưu ý trong một nhận xét cho câu hỏi này, có một danh sách đầy đủ các từ dừng mà không có bất kỳ loại giải thích nào. Tôi chỉ muốn biết nếu có một lý do đằng sau những từ "họ" đã chọn.

+0

Bạn có muốn sử dụng mySQL để tìm kiếm không? Bạn sẽ không hạnh phúc hơn khi thực hiện cái gì khác? – Layke

+0

@Laykes Tôi có thể hạnh phúc hơn khi sử dụng một khung công tác khác. Tôi đang phát triển rất thận trọng ngay bây giờ vì tôi không kiểm soát được máy chủ mà tôi đang phát triển. Tôi cũng không cần tìm kiếm nâng cao khủng khiếp cho trang web của mình. Dù bằng cách nào, tôi vẫn tò mò về danh sách từ dừng. –

+1

lạ, tôi không bao giờ biết về stopwords - đây là danh sách đầy đủ nhưng không có lời giải thích: http://dev.mysql.com/doc/refman/5.1/en/fulltext-stopwords.html –

Trả lời

8

Từ dừng chỉ là những từ thông dụng trong tiếng Anh. Trong hầu hết các trường hợp, kết quả tìm kiếm của bạn sẽ phù hợp hơn - và các chỉ mục của bạn sẽ nhỏ hơn và nhanh hơn - nếu bạn không lập chỉ mục những từ này.

Bạn có thể chỉnh sửa danh sách từ dừng bằng biến ft_stopword_file (hoặc đặt nó thành '' để lập chỉ mục tất cả các từ dài hoặc dài hơn ft_min_word_len) nếu phù hợp với nhu cầu của bạn tốt hơn. Bạn cũng có thể thay đổi độ dài từ được lập chỉ mục tối thiểu bằng biến ft_min_word_len, tồn tại cùng một lý do.

+0

Cảm ơn sự thấu hiểu! –

Các vấn đề liên quan