Tôi đang tìm cách tốt nhất dựa trên PHP để quét rất nhiều mục văn bản (Rao vặt) và kéo ra từ khóa - bất cứ ai biết về Part-of-Speech gắn thẻ? Có một cách PHP-ish để làm điều này?Làm thế nào để impliment một Part-of-Speech (POS) tagger
Tôi quét rất nhiều quảng cáo trực tuyến - nhưng không có mục nào! Để tăng tốc quá trình phân loại, tôi đang tìm cách cài đặt trình gắn thẻ Part-of-Speech (http://en.wikipedia.org/wiki/Part-of-speech_tagging). Về cơ bản, đây là những gói phần mềm thuật toán phân tích cú pháp văn bản có thể cho tôi biết từ nào là danh từ (như "Căn hộ", "Xe hơi", "Chó", v.v.) và những từ như rác, nếu, và, nhưng, v.v. . NHƯNG ...
Có các dịch vụ gắn thẻ trực tuyến - một dịch vụ của Yahoo, dường như ngày càng nhận được ít tình yêu hơn - một phiên bản khác của XEROX. Tuy nhiên, tôi thực sự quan tâm đến việc cài đặt thư viện/phần mềm của riêng mình và cắm nó vào ứng dụng web của tôi.
CÓ BẤT KONE ai biết cách tốt để cài đặt gắn thẻ POS hoạt động với ứng dụng web PHP không? Tôi đang chết để tìm ra điều này, vì vậy bất kỳ thông tin, lời khuyên, hoặc sự khôn ngoan khác mà bạn có thực sự được đánh giá cao!
Dưới đây là một danh sách của một LOT của phần mềm POS khác nhau: http://www-nlp.stanford.edu/links/statnlp.html#Taggers (Nhìn dưới "người gắn thẻ POS")
Thanks for reading này!
thẻ nào là trình gắn thẻ POS tốt nhất? bất kỳ ý tưởng? –