Trình phân tích cú pháp Stanford hiện 'an toàn chủ đề' kể từ version 2.0 (02.03.2012). Tôi hiện đang chạy các công cụ dòng lệnh và không thể tìm ra cách sử dụng nhiều lõi của tôi bằng cách luồng chương trình.Stanford Parser sử dụng đa luồng
Trong quá khứ, câu hỏi này đã được trả lời bằng "Stanford Parser không an toàn cho luồng", vì Câu hỏi thường gặp vẫn cho biết. Tôi hy vọng sẽ tìm thấy một người đã thành công trong việc truyền tải phiên bản mới nhất.
Tôi đã thử sử dụng -t cờ (-t10 và -tLLP) vì đó là tất cả những gì tôi có thể tìm thấy trong tìm kiếm của mình, nhưng cả hai đều ném lỗi.
Một ví dụ về một lệnh tôi đưa ra là:
java -cp stanford-parser.jar edu.stanford.nlp.parser.lexparser.LexicalizedParser \
-outputFormat "oneline" ./grammar/englishPCFG.ser.gz ./corpus > corpus.lex
Xin chào, tôi muốn lập trình với API thay vì sử dụng dòng lệnh. Bạn có nghĩa là không cần phải tách kho văn bản theo cách thủ công và LexicalizedParser sẽ xử lý việc chia tách và kết hợp công việc? vì vậy đa luồng là minh bạch cho các lập trình viên? – Matt
Nó không minh bạch. Nó có nghĩa là bạn có thể gọi các phương thức parseTree() hoặc apply() của LexicalizedParser trên các câu khác nhau cùng một lúc và nó sẽ hoạt động chính xác, trong khi nó không được sử dụng trước phiên bản 2.0. Làm thế nào bạn làm những việc sau đó là tùy thuộc vào bạn, nhưng cách Java hiện đại rõ ràng sẽ không chia nhỏ kho văn bản nhưng thiết lập một dịch vụ Executor và có một loạt các trình phân tích cú pháp của Executor đang chạy đồng thời. –
cảm ơn, tôi đã xem khóa học trực tuyến NLP của bạn. Điều đó cũng giúp ích rất nhiều! Sự tôn trọng. – Matt