2014-04-12 16 views
5

Tôi biết rằng sau khi đào tạo mô hình LDA cho gensim, chúng tôi có thể nhận được chủ đề cho một tài liệu vô hình theo:Gensim lấy chủ đề cho một tài liệu (tài liệu thấy)

lda = LdaModel(corpus, num_topics=10) 
doc_lda = lda[doc_bow] 

Nhưng làm thế nào về các tài liệu mà đã được sử dụng để đào tạo? Tôi có nghĩa là có một cách để có được các chủ đề cho một tài liệu trong corpus đã được sử dụng trong đào tạo mà không cần xử lý nó như một tài liệu mới?

Trả lời

4

số

Thông tin từ các tài liệu cá nhân được cất vào mô hình, sau đó bị lãng quên. Không có thông tin trên mỗi tài liệu được lưu giữ (thông thường hơn: không có thông tin nào yêu cầu giữ bộ nhớ O(#docs)).

+0

Nhưng nếu tôi muốn phân phối chủ đề cho tài liệu được đào tạo, vì vậy tôi có thể có một số loại hoạt động phân cụm, sau đó tôi có thể làm gì? – storen

Các vấn đề liên quan