Một số thuật toán tốt để tự động gắn nhãn văn bản với thành phố/khu vực hoặc nguồn gốc là gì? Đó là, nếu một blog là về New York, làm thế nào tôi có thể nói một cách có lập trình. Có gói/giấy tờ yêu cầu làm điều này với bất kỳ mức độ chắc chắn?Phương pháp gắn thẻ địa lý hoặc địa lý nội dung văn bản
Tôi đã xem xét một số phương pháp tiếp cận dựa trên tfidf, giao lộ danh từ thích hợp, nhưng cho đến nay, không có thành công ngoạn mục nào và tôi đánh giá cao ý tưởng!
Câu hỏi chung chung hơn là chỉ định văn bản cho chủ đề, được cung cấp một số danh sách chủ đề.
Phương pháp tiếp cận đơn giản/ngây thơ ưa thích đầy đủ trên phương pháp Bayesian, nhưng tôi mở.
Cảm ơn lời khuyên. Đây là một khó khăn, khó khăn, và câu trả lời của bạn, mà tôi tóm tắt là "Tra cứu NER" là tốt nhất có, có lẽ :) –
Bạn đã tìm thấy giải pháp đơn giản nào cho câu hỏi này .. ?? Vì tôi cũng đang tìm kiếm cùng một loại ứng dụng .. Tôi đã triển khai cấu trúc dữ liệu Trie của riêng mình và tôi cũng có thể dễ dàng tra cứu, nhưng vấn đề là thu thập dữ liệu. Tôi cần lấy tất cả dữ liệu trong từ điển ... Vui lòng chia sẻ suy nghĩ của bạn.. –