Được rồi, tôi đã khá quan tâm đến xử lý ngôn ngữ tự nhiên gần đây: tuy nhiên, tôi đã sử dụng C cho đến bây giờ cho hầu hết công việc của tôi. Tôi nghe nói về NLTK, và tôi không biết Python, nhưng nó có vẻ khá dễ học, và nó trông giống như một ngôn ngữ thực sự mạnh mẽ và thú vị. Đặc biệt, module NLTK có vẻ rất, rất thích nghi với những gì tôi cần làm.NLTK Performance
Tuy nhiên, khi sử dụng sample code for NLTK và dán vào một tệp có tên test.py
, tôi nhận thấy phải mất rất nhiều thời gian để chạy!
Tôi gọi đó là từ vỏ như vậy:
time python ./test.py
Và trên một máy 2,4 GHz với 4 GB RAM, phải mất 19,187 giây!
Bây giờ, có thể điều này là hoàn toàn bình thường, nhưng tôi đã có ấn tượng rằng NTLK là cực kỳ nhanh chóng; Tôi có thể đã bị nhầm lẫn, nhưng có điều gì rõ ràng rằng tôi rõ ràng đang làm sai ở đây?
Bạn cảm thấy rằng NLTK cực kỳ nhanh ở đâu? –
Trong mô tả Amazon về 'Xử lý văn bản Python với NLTK 2.0': "Tìm hiểu cách dễ dàng xử lý lượng dữ liệu khổng lồ mà không làm giảm hiệu quả hoặc tốc độ." (http://www.amazon.com/Python-Text-Processing-NLTK-Cookbook/dp/1849513600). – elliottbolzan