Tôi đang thử dùng TensorFlow và tôi đang gặp lỗi lạ. Tôi đã chỉnh sửa ví dụ MNIST sâu để sử dụng một tập hợp hình ảnh khác và thuật toán hội tụ lại một cách độc đáo, cho đến khoảng 8.000 lần lặp lại (độ chính xác 91% tại thời điểm đó) khi lỗi xảy ra với lỗi sau.Đầu vào yêu cầu ReluGrad của TensorFlow không phải là hữu hạn
tensorflow.python.framework.errors.InvalidArgumentError: ReluGrad input is not finite
Lúc đầu, tôi nghĩ có lẽ một số hệ số được đạt đến giới hạn cho một phao, nhưng thêm quy tắc l2 trên tất cả các trọng & những thành kiến không giải quyết được vấn đề này. Nó luôn là ứng dụng relu đầu tiên xuất hiện trong stacktrace:
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
Hiện tại tôi chỉ đang hoạt động trên CPU. Bất kỳ ý tưởng gì có thể gây ra điều này và làm thế nào để làm việc xung quanh nó?
Chỉnh sửa: Tôi đã truy tìm vấn đề này Tensorflow NaN bug?, giải pháp có hoạt động.
Tôi cũng nhận thấy rằng nếu dòng 'train_step = tf.train.AdamOptimizer (1e-4) .minimize (cross_entropy)' Tôi sửa đổi giá trị thành 1e-3, sự cố xảy ra trước đó đáng kể. Tuy nhiên, việc thay đổi nó thành 1e-5 sẽ ngăn không cho thuật toán hội tụ. – user1111929
Đối với Adam, bạn có thể muốn tăng đối số 'epsilon'. Giá trị mặc định hiện tại là 'epsilon = 1e-8'. Nhìn vào tài liệu. Nó nói "Ví dụ, khi đào tạo một mạng khởi động trên ImageNet một lựa chọn tốt hiện tại là 1.0 hoặc 0.1." Ngoài ra, hãy xem [this] (https://github.com/tensorflow/tensorflow/issues/323#issuecomment-159116515) thảo luận. – Albert