Tôi đang sử dụng gvidia GTX1080 (8GB) để chạy Inception model trên lưu lượng, khi tôi đặt batch_size = 16 và image_size = 400, thì sau khi tôi bắt đầu chương trình, ubuntu14 của tôi. 04 sẽ tự động khởi động lại.tự động khởi động lại hệ thống khi mô hình tensorflow quá lớn
Trả lời
Đảm bảo rằng đây không phải là sự cố đơn vị cung cấp điện. Tôi đã quan sát những lần khởi động lạ thường xuyên trên máy phát triển của mình. Khi tôi tăng kích thước của đầu vào (kích thước hàng loạt, NN lớn hơn) tốc độ khởi động lại cũng tăng lên. Hóa ra là một vấn đề PSU. Kiểm tra nhanh là giới hạn mức tiêu thụ điện năng GPU và xem liệu hành vi này có biến mất hay không. Ví dụ: bạn có thể giới hạn công suất tới khoảng 150 watt bằng lệnh này (bạn sẽ cần quyền sudo):
sudo nvidia-smi -pl 150
Tôi đã theo dõi sự cố xuống nguồn điện bị lỗi. Nó có đủ dung lượng theo thông số kỹ thuật và hạn chế tiêu thụ điện năng GPU bằng cách chạy "nvidia-smi -pl 150" không giúp gì cả. Có lẽ nó không thể xử lý các vụ nổ trong tiêu thụ điện năng.
Dù sao, sau khi tôi thay đổi nguồn điện từ "Corsair CX750 Builder Series ATX 80 PLUS" thành "Cooler Master V1000", sự cố đã biến mất. Xem chi tiết về điều tra của tôi trong số TensorFlow GitHub issue.
Thay đổi cài đặt nguồn GPU sẽ hoạt động, nếu bạn có PSU đủ công suất (WATTS). Tôi đã hạn chế sức mạnh của GPU (TITANX) tối đa. 200 WATTS sử dụng,
sudo nvidia-smi -pl 200
LƯU Ý: Mỗi GPU có giới hạn về nguồn, ví dụ: Giới hạn công suất của TITANX là từ 125W đến 300W. Vì vậy, hãy đảm bảo cung cấp giá trị giữa các giới hạn đó.
- 1. Làm cách nào để tạo vùng chứa Docker tự động khởi động khi khởi động hệ thống?
- 2. Làm thế nào để tự động khởi động Kafka khi khởi động hệ thống trong Ubuntu 14.04?
- 3. Kết nối lại với Hệ thống Từ xa Akka sau khi Khởi động lại Máy khách
- 4. Làm thế nào để đảm bảo đơn vị khởi động khi khởi động hệ thống?
- 5. Đặt chương trình vào khay hệ thống khi khởi động
- 6. Dịch vụ Windows sẽ không tự động khởi động sau khi khởi động lại
- 7. Khởi động MIDlet tự động khi khởi động lại thiết bị?
- 8. Khởi động lại khi khởi động/Khởi động lại hành khách
- 9. Tự động khởi động lại ứng dụng Net khi thay đổi cấu hình
- 10. Ubuntu 14.04 - pm2 khởi động không bắt đầu sau khi khởi động lại
- 11. Cách lấy thời gian khởi động hệ thống Android
- 12. Lập trình khởi động hệ thống trong c + + (windows)
- 13. bash script để khởi động lại Apache tự động
- 14. Khởi động lại/Tự động ghép Mongodb trong Sản xuất
- 15. Im lặng Windows Installer cài đặt mà không cần khởi động lại tự động
- 16. Chạy Jetty tự động khi khởi động
- 17. Tự động cấu hình lại reinitialization trong Spring
- 18. Cách tương thích POSIX để biết liệu hệ thống đã khởi động lại chưa?
- 19. Làm cách nào để khởi chạy ứng dụng khi khởi động hệ thống? (Mac OSX, Cocoa)
- 20. Geofences Android có còn lại khi khởi động lại không?
- 21. Tự động khởi động lại ứng dụng Erlang
- 22. hệ thống của tôi từ chối tắt/khởi động lại với lớp NSAppleScript
- 23. MacOSX: tự khởi động mysql khi khởi động
- 24. Rails 5 khởi động lại máy chủ mỗi khi điều khiển hoặc thay đổi mô hình
- 25. Khởi động lại thiết bị USB một cách có hệ thống trong Windows
- 26. Tự động khởi động lại ứng dụng sau khi cập nhật thị trường
- 27. Cách dừng tự động khởi động lại máy chủ
- 28. Cách khởi động lại dịch vụ?
- 29. Khi nào khởi động lại và không tải lại Nginx?
- 30. Hibernate có tự động khởi động lại các giao dịch khi deadlocking không?
Bạn có thể muốn thêm giá trị của batch_size và image_size có vẻ như gây ra sự cố để nhận câu trả lời có liên quan. – fvu
cấu hình hệ thống là gì? – titus
tensorflow là nghĩa vụ phải ném một lỗi Out Of Memory, không khởi động lại hệ thống. – suiyuan2009