2014-10-18 16 views
11

Tôi đã cố gắng tìm ra một giải pháp thay thế cho hai ngày liên tục ngay bây giờ và không thể tìm thấy bất kỳ nội dung nào có liên quan. Về cơ bản, tôi cố gắng đạt được điểm số xác suất của một câu tổng hợp (được tổng hợp bằng cách thay thế một số từ trong câu gốc được chọn từ tập đoàn).Có thay thế cho mô-đun đã bị loại bỏ 'nltk.model.NGramModel' không?

Tôi đã thử Collocations, nhưng điểm số mà tôi nhận được không phải là rất hữu ích. Vì vậy, tôi đã cố gắng sử dụng khái niệm mô hình ngôn ngữ, chỉ để thấy rằng mô-đun dường như hữu ích 'mô hình' đã bị xóa khỏi NLTK vì một số lỗi. Nó thực sự tuyệt vời nếu ai đó có thể cho tôi biết về một số cách thay thế để thực hiện mô hình ngram trong python, hoặc tốt hơn, gợi ý cho tôi một số cách khác để giải quyết vấn đề 'chấm điểm' câu.

+0

Tôi đã tải xuống phiên bản 3.0a1 theo cách thủ công (phiên bản cuối cùng chứa mô hình) và tôi đang sử dụng phiên bản đó, không phải không đau. "Đề xuất chính thức" là sử dụng các phiên bản mới nhất trong nhánh 'model'. Tuy nhiên, tôi không có ý tưởng về cách sử dụng, tất cả thông tin trực tuyến để hoàn thành công việc đều đề cập đến gói mô hình cũ trong phiên bản 3.0a1, vì vậy tôi quyết định sử dụng nó. Tôi đã không sử dụng nhiều Python và nltk, nhưng ấn tượng của tôi là cả hai đều trưởng thành hơn và có sự hỗ trợ cộng đồng mạnh mẽ hơn. – Trylks

Trả lời

14

Theo this open issue on the nltk repo, NGramModel hiện không ở chế độ chính vì một số lỗi. Giải pháp hiện tại của họ là cài đặt mã từ nhánh mô hình. Tuy nhiên, đây là khoảng 8 tháng so với tổng thể, vì vậy, bạn có thể bỏ lỡ các tính năng và sửa lỗi khác.

pip install https://github.com/nltk/nltk/tarball/model 

Mã có liên quan là here in the model branch. Bạn có thể sao chép mã này vào mã cục bộ của mình nếu bạn không muốn sử dụng chi nhánh đã lỗi thời. Nếu bạn thực sự quan tâm đến việc sử dụng điều này, bạn có thể cố gắng sửa chữa the outstanding bugs trên đó và gửi yêu cầu kéo.

Các vấn đề liên quan