2013-12-14 12 views
12

Tôi có một danh sách các câu và tôi muốn phân tích mọi câu và xác định các vai trò ngữ nghĩa trong câu đó. Làm thế nào để làm điều đó?Dán nhãn vai trò ngữ nghĩa bằng NLTK

Tôi đã xem qua PropBankCorpusReader trong mô-đun NLTK để thêm thông tin ghi nhãn ngữ nghĩa vào Penn Treebank. Ngoài ra nghiên cứu của tôi trên internet cho thấy rằng mô-đun này được sử dụng để thực hiện việc dán nhãn vai trò ngữ nghĩa.

Tuy nhiên, tôi không thể tìm thấy một HOWTO nhỏ giúp tôi hiểu cách chúng tôi có thể tận dụng PropBankCorpusReader để thực hiện SRL trên văn bản đơn phương.

Do đó, ai đó có thể chỉ ra các ví dụ về việc sử dụng PropbankCorpusReader để thực hiện SRL đối với các câu đơn độc?

Trả lời

8

SRL không phải là vấn đề tầm thường, và không thực sự có thể thực hiện được gì đó từ hộp sử dụng nltk.

Bạn có thể phá vỡ các nhiệm vụ SRL thành 3 bước riêng biệt:

  1. Xác định vị.
  2. Thực hiện định nghĩa từ định nghĩa trên biến vị ngữ để xác định đối số ngữ nghĩa nào được chấp nhận.
  3. Xác định đối số ngữ nghĩa trong câu.

Hầu hết các cách tiếp cận hiện tại cho vấn đề này sử dụng máy học được giám sát, nơi phân loại sẽ đào tạo trên một tập con của câu Propbank hoặc FrameNet và sau đó kiểm tra trên tập con còn lại để đo lường độ chính xác của nó. Các nhà nghiên cứu có xu hướng tập trung vào tinh chỉnh các tính năng và thuật toán, cũng như tinkering với các bước trên được thực hiện tuần tự hoặc đồng thời, và theo thứ tự nào.

Một số giấy tờ bạn có thể muốn kiểm tra là:

Phương pháp Markov Logic là đầy hứa hẹn nhưng theo kinh nghiệm của riêng tôi nó chạy vào các vấn đề khả năng mở rộng nghiêm trọng (tôi đã từng sử dụng chỉ Alchemy, mặc dù Alchemy Lite vẻ thú vị). Nó không phải là một số lượng lớn công việc để thực hiện một số loại phân loại bằng cách sử dụng dữ liệu nltk Propbank, và một số off the shelf classifiers đã tồn tại trong Python.

EDIT:This assignment từ Đại học Edinburgh đưa ra một số ví dụ về cách phân tích dữ liệu Propbank, và part of a school project tôi đã thực hiện một hoàn Propbank tính năng phân tích cú pháp, mặc dù các tính năng được đặc biệt nhắm hướng sử dụng trong Markov logic Networks theo phong cách của Meza-Ruiz và Riedel (2009).

Các vấn đề liên quan