2012-05-01 24 views

Trả lời

132

Cây phân tích bầu cử sẽ chia nhỏ văn bản thành các cụm từ con. Không phải thiết bị đầu cuối trong cây là các loại cụm từ, các thiết bị đầu cuối là những từ trong câu, và các cạnh không có nhãn. Đối với một câu đơn giản "John nhìn thấy Bill", một phân tích bầu cử sẽ là:

    Sentence 
        | 
     +-------------+------------+ 
     |       | 
    Noun Phrase    Verb Phrase 
     |       | 
    John     +-------+--------+ 
          |    | 
         Verb   Noun Phrase 
          |    | 
         sees    Bill 

Phân tách phụ thuộc kết nối các từ theo mối quan hệ của chúng. Mỗi đỉnh trong cây đại diện cho một từ, các nút con là các từ phụ thuộc vào bố mẹ và các cạnh được gắn nhãn bởi mối quan hệ. Một phân tích phụ thuộc của "John thấy Bill", sẽ là:

   sees 
       | 
     +--------------+ 
subject |    | object 
     |    | 
     John   Bill 

Bạn nên sử dụng loại trình phân tích cú pháp giúp bạn gần nhất với mục tiêu của mình. Nếu bạn quan tâm đến các cụm từ phụ trong câu, bạn có thể muốn phân tích cú pháp bầu cử. Nếu bạn quan tâm đến các mối quan hệ phụ thuộc giữa các từ, thì bạn có thể muốn phân tích cú pháp phụ thuộc.

Trình phân tích cú pháp Stanford có thể cung cấp cho bạn (online demo). Trong thực tế, cách nó thực sự hoạt động là luôn phân tích câu với trình phân tích cú pháp bầu cử, và sau đó, nếu cần, nó thực hiện phép biến đổi (dựa trên quy tắc) xác định trên cây phân tích bầu cử để chuyển đổi nó thành cây phụ thuộc.

thêm có thể được tìm thấy ở đây:

http://en.wikipedia.org/wiki/Phrase_structure_grammar

http://en.wikipedia.org/wiki/Dependency_grammar

+0

Trong reagrds NLP, mà là ứng dụng cho phân tích thành phần? Phân tích phụ thuộc rất hữu ích nhưng ở đâu chính xác tôi có thể sử dụng đầu ra phân tích thành phần? – arjun

+0

> Phương pháp phân tích dựa trên thành phần để phân tích cung cấp thông tin tương tự, nhưng nó thường phải được chưng cất từ ​​cây thông qua các kỹ thuật như quy tắc tìm kiếm đầu được thảo luận trong Chương 11. https://web.stanford.edu/~jurafsky/slp3/ 11.pdf – gkiko

Các vấn đề liên quan