2015-06-17 36 views
6

Tôi đang thử mô hình phân loại rừng ngẫu nhiên bằng cách sử dụng thư viện H2O bên trong R trên bộ đào tạo có 70 triệu hàng và 25 đối tượng dạng số. Tổng kích thước tệp là 5,6 GB.Tại sao kết nối bị chấm dứt

Kích thước của tệp xác thực là 1 GB.

Tôi có RAM 16 GB và 8 lõi CPU trên hệ thống của mình.

Hệ thống có thể đọc thành công cả hai tệp trong đối tượng H2O.

Sau đó tôi đưa ra dưới đây lệnh để xây dựng mô hình:

model <- h2o.randomForest(x = c(1:18,20:25), y = 19, training_frame = traindata, 
          validation_frame = testdata, ntrees = 150, mtries = 6) 

Nhưng sau vài phút (không tạo ra bất kỳ cây), tôi nhận được lỗi sau:

"Error in .h2o.doSafeREST(conn = conn, h2oRestApiVersion = h2oRestApiVersion, : Unexpected CURL error: Recv failure: Connection reset by peer"

Tuy nhiên Nếu Tôi đã thử trên mã với 1 cây, chạy nó thành công.

Lỗi trên có xảy ra do sự cố bộ nhớ không? Bất kỳ trợ giúp sẽ được đánh giá cao.

Trả lời

3

Có thể bạn đã hết bộ nhớ. Hãy thử tìm kiếm việc sử dụng bộ nhớ của hệ thống trong quá trình phát triển rừng. Cũng cố gắng để khởi động đào tạo trực tiếp từ giao diện điều khiển web H2O (http://localhost:54321/ theo mặc định), có thể nó sẽ cung cấp cho lỗi chi tiết hơn.

+0

tôi đã kiểm tra mức sử dụng bộ nhớ trong quá trình phát triển rừng. Bộ nhớ giảm nhanh và cuối cùng tôi gặp lỗi kết nối. tôi sẽ giết quá trình khác, và chỉ chạy bản ngã RF. – rks

+0

Hãy cho chúng tôi biết nếu điều đó có ích. Ngoài ra, bạn có thể thử phương pháp tiếp cận ML ít đòi hỏi tài nguyên hơn như mạng thần kinh sâu, cũng tồn tại trong phiên bản cơ sở H2O. – cyberj0g

+1

Đó là sai lầm của tôi. Trước đây tôi đã chạy trường hợp H2O với tùy chọn bộ nhớ mặc định (Đó là quá ít cho dữ liệu của tôi). Bây giờ tôi đang chạy thể hiện H2O với tùy chọn -Xmx14g và algo đang chạy thành công. Chúc mừng ... :). Tôi sẽ xem xét đề xuất của bạn về học tập sâu nếu tôi sẽ có được độ chính xác ít hơn một ngưỡng trong trường hợp của tôi. – rks

2

Đó là lỗi OutOfMemoryError. Một biến thể của thông báo lỗi này ở phía bên R là:

Error in .h2o.doSafeREST(conn = conn, h2oRestApiVersion = h2oRestApiVersion, : 
    Unexpected CURL error: Empty reply from server 

Kiểm tra các bản ghi máy chủ h2o, mà bạn nên làm là tốt, sẽ cho bạn biết:

10-08 20:11:57.165 192.168.0.4:54321  2125 #58072-18 INFO: Total file size: 1.81 GB 
10-08 20:11:57.165 192.168.0.4:54321  2125 #58072-18 INFO: Parse chunk size 4194304 
     onExCompletion for [email protected] 
     java.lang.OutOfMemoryError: Java heap space 
: 
: 
Exception in thread "FJ-0-11" java.lang.OutOfMemoryError: Java heap space 
2015-10-08 20:13:14.493:WARN:oejut.QueuedThreadPool:1 threads could not be stopped 
10-08 20:13:23.033 192.168.0.4:54321  2125 FJ-0-5 ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321 
10-08 20:13:23.458 192.168.0.4:54321  2125 FJ-0-3 ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321 
10-08 20:13:23.033 192.168.0.4:54321  2125 FJ-0-13 ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321 
10-08 20:13:23.033 192.168.0.4:54321  2125 FJ-0-7 ERRR: Out of Memory, Heap Space exceeded, increase Heap Size, from /192.168.0.4:54321 
10-08 20:13:26.541 192.168.0.4:54321  2125 FJ-0-5 FATAL: Exiting. 
10-08 20:13:26.574 192.168.0.4:54321  2125 FJ-0-7 FATAL: Exiting. 
10-08 20:13:26.575 192.168.0.4:54321  2125 FJ-0-3 FATAL: Exiting. 
10-08 20:13:26.575 192.168.0.4:54321  2125 FJ-0-13 FATAL: Exiting. 

Tôi đang chạy này trên h2o Slater (3.2.0.5), do đó, tùy thuộc vào phiên bản của bạn, điều này có thể khác nhau.

Các vấn đề liên quan