Có cách nào để tìm tất cả các câu phụ của câu vẫn có ý nghĩa và chứa ít nhất một chủ đề, động từ và một biến vị ngữ/đối tượng không?Tìm các câu phụ có ý nghĩa từ một câu
Ví dụ: nếu chúng tôi có câu như "Tôi sẽ tổ chức hội thảo về NLP tại SXSW ở Austin vào tháng tới". Chúng tôi có thể trích xuất các câu phụ có ý nghĩa sau đây từ câu này: "Tôi sẽ tổ chức hội thảo", "Tôi sẽ tổ chức hội thảo về NLP", "Tôi sẽ tổ chức hội thảo về NLP tại SXSW", " Tôi sẽ tổ chức một hội thảo tại SXSW "," Tôi sẽ tổ chức một hội thảo ở Austin "," Tôi sẽ tổ chức một hội thảo về NLP vào tháng tới ", v.v.
Xin lưu ý rằng không có suy luận câu ở đây (ví dụ: "Sẽ có một hội thảo NLP tại SXSW vào tháng tới". Mặc dù điều này là đúng, chúng tôi không cần điều này như là một phần của vấn đề này.). Tất cả các câu được tạo ra đều là một phần của câu đã cho.
Làm cách nào chúng tôi có thể tiếp cận giải quyết vấn đề này? Tôi đã nghĩ đến việc tạo dữ liệu đào tạo có chú thích có một tập hợp các câu con hợp pháp cho mỗi câu trong tập dữ liệu huấn luyện. Và sau đó viết một số thuật toán học được giám sát (s) để tạo ra một mô hình.
Tôi khá mới với NLP và Học máy, vì vậy sẽ rất tuyệt nếu các bạn có thể đề xuất một số cách để giải quyết vấn đề này.
Trong ví dụ của bạn, làm bạn cũng muốn subsentences tầm thường như "Tôi sẽ" và "Tôi"? Làm thế nào về "Tôi sẽ đến Austin vào tháng tới"? –
@Adrian McCarthy: "Tôi sẽ đến Austin vào tháng tới" sẽ rơi vào "các câu được suy luận" như được mô tả trong câu hỏi.Đây không phải là mong muốn ở đây, vì chúng ngụ ý một điều trị ngữ nghĩa của câu đầu vào theo đó, như tôi đã hiểu, ý tưởng chỉ là bao gồm/loại trừ các kết hợp khác nhau của các cụm từ giới từ đủ điều kiện từ văn bản gốc. – mjv
@Adrian McCarthy: bạn đã nêu lên một điểm tốt đẹp. Câu phụ "Tôi sẽ đến Austin" rơi phần nào trên một đường biên giới giữa câu suy luận và một câu phụ "nghiêm ngặt". Nhưng vì yêu cầu là chỉ liệt kê các câu phụ được tìm thấy nghiêm ngặt trong câu, chúng tôi sẽ bỏ qua câu này. –