Tôi nghi ngờ liệu tensorflow có được định cấu hình chính xác trên hộp gpu hay không, vì tốc độ chậm hơn 100 lần cho mỗi lần lặp lại để đào tạo mô hình hồi quy tuyến tính đơn giản (batchsize = 32, 1500 tính năng đầu vào, 150 biến đầu ra) trên máy tính gpu ưa thích của tôi hơn trên máy tính xách tay của tôi.benchmark chuẩn để kiểm tra lưu lượng tensorflow
Tôi đang sử dụng Titan X, với cpu hiện đại, v.v. nvidia-smi nói rằng tôi chỉ ở mức sử dụng 10% gpu, nhưng tôi hy vọng đó là do các lô nhỏ. Tôi không sử dụng feed_dict để chuyển dữ liệu vào biểu đồ tính toán. Mọi thứ đều đến thông qua một tf.decode_csv và tf.train.shuffle_batch.
Có ai có bất kỳ đề xuất nào về cách dễ dàng kiểm tra xem cài đặt của tôi có đúng không? Có bất kỳ điểm chuẩn tốc độ đơn giản nào không? Sự khác biệt về tốc độ giữa máy tính xách tay của tôi và máy gpu rất ấn tượng đến nỗi tôi hy vọng rằng mọi thứ không được cấu hình đúng cách.
Một số ví dụ không được tối ưu hóa cho GPU và có thể nhận được 100x chậm hơn khi GPU được kích hoạt vì bản, đây là một địa chỉ https: //github.com/tensorflow/tensorflow/issues/838 –