2016-04-18 18 views
7

Ví dụ: dữ liệu của tôi không phù hợp với bộ nhớ tôi có thể làm:(làm thế nào) bạn có thể đào tạo một mô hình hai lần (nhiều lần) trong sklearn sử dụng phù hợp.?

model=my_model 
for i in range(20) 
     model.fit(X_i,Y_i) 

này sẽ xóa 19 phù hợp đầu tiên. và chỉ giữ cái cuối cùng. Làm cách nào để tránh điều này? Tôi có thể đào tạo lại mô hình được lưu và tải không? Cảm ơn bạn

+0

Tùy thuộc vào loại dữ liệu bạn đang làm việc với, tạo ra một ma trận thưa thớt có thể là một giải pháp khả thi: http://docs.scipy.org/doc/scipy/reference/sparse.html Đối với tôi điều này đã tạo ra sự khác biệt giữa việc phải phù hợp với một cá thể với "rất nhiều" RAM (~ 16gb +) và có thể vừa với máy tính xách tay của tôi với 4GB RAM. Bạn cũng sẽ phải lên kế hoạch trước và xem mô hình nào hỗ trợ đầu vào thưa thớt (không phải tất cả) – Ryan

Trả lời

5

Một số mô hình có một "warm_start" tham số, nơi mà nó sẽ khởi tạo các thông số mô hình với các giải pháp trước từ phù hợp()

Xem ví dụ SGDClassifier

Các vấn đề liên quan