Khi tôi chạy mô hình LdaMulticore
gensim của trên một máy với 12 lõi, sử dụng:gensim LdaMulticore không đa xử lý?
lda = LdaMulticore(corpus, num_topics=64, workers=10)
tôi nhận được một tin nhắn đăng nhập mà nói
using serial LDA version on this node
Một vài dòng sau, tôi thấy một thông báo loging mà nói
training LDA model using 10 processes
Khi tôi chạy trên cùng, tôi thấy 11 quá trình python đã được sinh ra, nhưng 9 đang ngủ, tức là chỉ có một công nhân hoạt động. Máy có 24 lõi, và không bị choáng ngợp bởi bất kỳ phương tiện nào. Tại sao LdaMulticore không hoạt động ở chế độ song song?
Một lý do có thể là do [tải chậm tập tin 'corpus'] (https://github.com/piskvorky/gensim/issues/288). Kiểm tra mã của bạn để xem mất bao nhiêu thời gian. – Jon