Tôi đang cố gắng sử dụng CRFSuite nhưng tôi không thể tìm ra cách để sử dụng ví dụ/ner.py và pos.pyChạy ví dụ CRFSuite
Chính xác, làm thế nào để làm cho một đầu vào có dạng:
# Ner.py
fields = 'y w pos chk'
hoặc
# Pos.py
fields = 'w num cap sym p1 p2 p3 p4 s1 s2 s3 s4 y'
các "yw pos" tôi có thể nhận được từ một mô hình CoNNL, ví dụ, nhưng "chk" phần và tất cả những lĩnh vực trong pos.py tôi không thực sự có được .
Ngoài ra, có cách nào để xử lý văn bản thô (không có tất cả các thẻ đó) với CRFSuite do tôi có mô hình được đào tạo không?
tôi cũng vậy, tôi quan tâm đến việc giải quyết vấn đề này; Paticularly, bắt đầu từ dữ liệu CoNLL trích dẫn (2000 cho chunking, 2003 cho NER, nhưng những gì để sử dụng cho PoS?), Làm thế nào để tôi tạo ra các dữ liệu PoS. Như đã trích dẫn, đầu vào phải là ''w num cap sym p1 p2 p4 s4 s2 s3 s4 y'', có nghĩa là từ đầu tiên và thẻ PoS cuối cùng. Nhưng tất cả những thứ ở giữa và làm thế nào để có được và tạo ra nó? – fnl
Có lẽ câu hỏi liên quan đến phần PoS chính xác hơn là: Làm thế nào để tạo ra định dạng đầu vào gắn thẻ PoS từ một tệp OWPL được gắn thẻ PoS thường xuyên ('" thẻ từ \ n "...') bằng cách sử dụng các tập lệnh này? – fnl