Tôi cần trích xuất tất cả tên thành phố từ một trang web. Tôi đã sử dụng beautifulSoup với RE trong các dự án trước nhưng trên trang web này tên thành phố là một phần của văn bản thông thường và không có định dạng cụ thể. Tôi tìm thấy gói geograpy (https://pypi.python.org/pypi/geograpy/0.3.7) đáp ứng các yêu cầu của tôi."NotImplementedError: Sử dụng nhãn() để truy cập nhãn nút"
Geograpy sử dụng gói nltk. Tôi đã cài đặt tất cả các mô hình và các gói cho NLTK nhưng nó vẫn không ngừng ném lỗi này:
>>> import geograpy
>>> places = geograpy.get_place_context(url="http://www.state.gov/misc/list/")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Python27\lib\site-packages\geograpy\__init__.py", line 6, in get_place_context
e.find_entities()
File "C:\Python27\lib\site-packages\geograpy\extraction.py", line 31, in find_entities
if (ne.node == 'GPE' or ne.node == 'PERSON') and ne[0][1] == 'NNP':
File "C:\Python27\lib\site-packages\nltk\tree.py", line 198, in _get_node
raise NotImplementedError("Use label() to access a nod label.")
NotImplementedError: Use label() to access a node label.
Bất kỳ trợ giúp sẽ được đánh giá
Cảm ơn câu trả lời. Tôi đã tự tìm ra điều này. Tôi đã thực sự hy vọng rằng ai đó sẽ giúp tôi trong 'sửa chữa' gói này. Có thể là một người có kinh nghiệm với nltk. Đối với việc sử dụng một gói khác nhau, tôi đã tìm kiếm một gói tương tự cho ngày nhưng chưa tìm thấy bất kỳ điều nào. – Faisal