Tôi nhận thấy đây là một chủ đề rộng, nhưng tôi đang tìm kiếm một mồi tốt về phân tích ý nghĩa từ văn bản, lý tưởng trong Python. Như một ví dụ về những gì tôi đang tìm cách để làm, nếu một người dùng thực hiện một bài viết trên blog như:Phân tích ý nghĩa từ văn bản
"Manny Ramirez làm cho lợi nhuận của mình cho Dodgers ngày nay so với đồng Houston Astros",
một trọng lượng nhẹ là những gì/cách dễ dàng để nhận được danh từ trong một câu? Để bắt đầu, tôi nghĩ rằng tôi sẽ giới hạn nó vào danh từ thích hợp, nhưng tôi sẽ không muốn bị giới hạn chỉ đó (và tôi không muốn dựa vào một regex đơn giản mà giả định bất cứ điều gì Tiêu đề Capped là một danh từ thích hợp).
Để làm cho câu hỏi này trở nên tồi tệ hơn, những điều tôi không yêu cầu là gì? Tôi có cần một tập hợp các từ hiện có để bắt đầu không? Tôi cần biết những công cụ phân tích từ vựng nào để thực hiện công việc này? Tôi đã đi qua one other question về chủ đề này và tôi đang đào bới các tài nguyên đó ngay bây giờ.
Ha, tôi vừa thêm vào giỏ hàng của tôi tại Amazon trước khi quay lại đây. Có cái nào tốt không? Tôi đã tự hỏi về việc thiếu đánh giá. – Tom
Dường như nó có mô tả khá phong nha về NTLK - bộ công cụ được đề cập trong một trong những câu trả lời – zakovyrya