Tôi có một danh sách lớn (hơn 1.000.000 bài), trong đó có chứa các từ tiếng Anh:mục Lọc mà chỉ xảy ra một lần trong một danh sách rất lớn
tokens = ["today", "good", "computer", "people", "good", ... ]
Tôi muốn có được tất cả các mục mà chỉ xảy ra một lần trong danh sách
bây giờ tôi đang sử dụng:
tokens_once = set(word for word in set(tokens) if tokens.count(word) == 1)
nhưng nó thực sự chậm. làm thế nào tôi có thể làm cho điều này nhanh hơn?
trong Python 3, 'iteritems' đã được đổi tên thành' mục' –