Tôi muốn tìm hiểu xem văn bản nào xuất hiện sau khi cá thể trùng lặp trả về. Vì vậy, ví dụ, nếu bạn nhìn vào một ví dụ họ đưa ra trong 'Searching Text' section, họ nhận được sự phù hợp của từ 'quái dị'. Làm thế nào bạn sẽ nhận được từ mà đến ngay sau khi một trường hợp quái dị?Gọi sự phù hợp của NLTK - cách nhận văn bản trước/sau một từ đã được sử dụng?
10
A
Trả lời
18
import nltk
import nltk.book as book
text1 = book.text1
c = nltk.ConcordanceIndex(text1.tokens, key = lambda s: s.lower())
print([text1.tokens[offset+1] for offset in c.offsets('monstrous')])
mang
['size', 'bulk', 'clubs', 'cannibal', 'and', 'fable', 'Pictures', 'pictures', 'stories', 'cabinet', 'size']
Tôi thấy điều này bằng cách nhìn lên như thế nào phương pháp concordance
được định nghĩa.
Điều này cho thấy text1.concordance
được định nghĩa trong /usr/lib/python2.7/dist-packages/nltk/text.py
:
In [107]: text1.concordance?
Type: instancemethod
Base Class: <type 'instancemethod'>
String Form: <bound method Text.concordance of <Text: Moby Dick by Herman Melville 1851>>
Namespace: Interactive
File: /usr/lib/python2.7/dist-packages/nltk/text.py
Trong tập tin mà bạn sẽ tìm thấy
def concordance(self, word, width=79, lines=25):
...
self._concordance_index = ConcordanceIndex(self.tokens,
key=lambda s:s.lower())
...
self._concordance_index.print_concordance(word, width, lines)
Điều này cho thấy làm thế nào để nhanh chóng ConcordanceIndex
đối tượng.
Và trong cùng một tập tin bạn cũng sẽ tìm thấy:
class ConcordanceIndex(object):
def __init__(self, tokens, key=lambda x:x):
...
def print_concordance(self, word, width=75, lines=25):
...
offsets = self.offsets(word)
...
right = ' '.join(self._tokens[i+1:i+context])
Với một số thử nghiệm trong phiên dịch IPython, điều này cho thấy self.offsets('monstrous')
đưa ra một danh sách các số (offsets) mà từ monstrous
có thể được tìm thấy. Bạn có thể truy cập các từ thực tế với self._tokens[offset]
, tương tự như text1.tokens[offset]
.
Từ tiếp theo sau monstrous
được cung cấp bởi text1.tokens[offset+1]
.
Các vấn đề liên quan
- 1. Trích từ sử dụng nltk từ văn bản tiếng Đức
- 2. Làm cách nào để tạo văn bản NLTK của riêng tôi từ một tệp văn bản?
- 3. Sự hợp nhất của văn bản
- 4. nhận văn bản đã chọn từ một uiwebview Xcode
- 5. Các từ phù hợp với trình phân tích cú pháp của NLTK
- 6. Nhận văn bản của mục đã chọn trong một ListBox
- 7. Sử dụng kho văn bản riêng của tôi để phân loại danh mục bằng Python NLTK
- 8. Sự phù hợp của một Textbox Django trong một Model
- 9. Tạo một kho văn bản mới với NLTK
- 10. Không thể nhận được kết quả phù hợp từ tìm kiếm toàn văn sau bưu điện
- 11. Loại không phù hợp về giá trị từ bản đồ: dự kiến org.apache.hadoop.io.NullWritable, nhận được org.apache.hadoop.io.Text
- 12. Cách nhận văn bản từ EditText?
- 13. Cách nhận văn bản được chọn từ edittext trong android?
- 14. Sử dụng PHP để tạo file PDF từ một kết hợp của văn bản đơn giản và văn bản HTML
- 15. Nhận văn bản từ tuổi sử dụng jquery
- 16. Căn chỉnh văn bản phù hợp nhưng ở bên phải?
- 17. Nhận url từ một văn bản
- 18. Nhận văn bản đã chọn của hộp kết hợp bằng jQuery, theo tên của hộp tổ hợp?
- 19. Phát hiện một số văn bản đã được chọn trong một hộp văn bản
- 20. phù hợp với văn bản trong dấu ngoặc kép (newbie)
- 21. Python: Nhận văn bản của một trận đấu Regex
- 22. NLTK được gọi là nhận dạng đối tượng bằng tiếng Hà Lan
- 23. Làm thế nào phù hợp với một mẫu trong văn bản bằng cách sử dụng máy quét và lớp mẫu?
- 24. Android - Cách sử dụng AsyncTask phù hợp?
- 25. NLTK pos_tag sử dụng
- 26. Lịch sử phiên bản phù hợp
- 27. Nhận HTML được làm sạch trong văn bản từ HtmlCleaner
- 28. Xuất hiện văn bản không có cấu trúc trong NLTK
- 29. Nhận văn bản thuần tuý từ văn bản RTF
- 30. jquery bấm phím() sự kiện nhận được văn bản