2012-10-23 37 views
12

Tôi mới bắt đầu sử dụng Stanford Parser nhưng tôi không hiểu các thẻ rất tốt. Đây có thể là một câu hỏi ngu ngốc để hỏi nhưng bất cứ ai có thể cho tôi biết những gì hiện các thẻ SBARQ và SQ đại diện và nơi tôi có thể tìm thấy một danh sách đầy đủ cho họ? Tôi biết Penn Treebank trông như thế nào nhưng chúng hơi khác một chút.Thẻ Stanford Parser

Sentence: What is the highest waterfall in the United States ? 

(ROOT 
    (SBARQ 
    (WHNP (WP What)) 
    (SQ (VBZ is) 
     (NP 
     (NP (DT the) (JJS highest) (NN waterfall)) 
     (PP (IN in) 
      (NP (DT the) (NNP United) (NNPS States))))) 
    (. ?))) 

Tôi đã xem trang web Stanford Parser và đọc một số tạp chí được liệt kê ở đó nhưng không có giải thích về các thẻ được đề cập trước đó. Tôi tìm thấy một hướng dẫn mô tả tất cả các phụ thuộc được sử dụng nhưng nó không giải thích những gì tôi đang tìm kiếm. Cảm ơn!

Trả lời

21

This reference dường như có danh sách mở rộng - không chắc liệu danh sách có đầy đủ hay không.

Cụ thể, nó sẽ liệt kê những cái bạn đang hỏi về như:

SBARQ - Direct question introduced by a wh-word or a wh-phrase. Indirect 
     questions and relative clauses should be bracketed as SBAR, not SBARQ. 
SQ - Inverted yes/no question, or main clause of a wh-question, 
     following the wh-phrase in SBARQ. 
+1

Cảm ơn bạn. Bạn đã giúp đỡ rất nhiều. Nhiều hơn bạn biết. Thành thật mà nói tôi đã tìm kiếm 2-3 tuần qua nhưng tôi nghĩ rằng nó không khó để tìm và tôi không muốn làm phiền ai cả. Tôi đoán tôi đã nhìn vào những nơi sai. Cảm ơn bạn một lần nữa! – Cryssie

+0

Thẻ cấp khoản. Tìm hiểu thêm tại đây: http://bulba.sdsu.edu/jeanette/thesis/PennTags.html –

+7

http://bulba.sdsu.edu/jeanette/thesis/PennTags.html dường như đã chuyển sang chế độ ngoại tuyến. Tôi đã sao chép thông tin vào https://gist.github.com/nlothian/9240750 –

-1

Để xem toàn bộ danh sách chỉ in tagIndex của bộ phân tích

LexicalizedParser lp = LexicalizedParser.loadModel(); 
    System.out.println(lp.tagIndex); // print the tag index