Có một số hoạt động hình ảnh trong TensorFlow được sử dụng để bóp méo hình ảnh đầu vào trong quá trình đào tạo, ví dụ: tf.image.random_flip_left_right(image, seed=None)
và tf.image.random_brightness(image, max_delta, seed=None)
và một số mục khác.TensorFlow hoạt động hình ảnh cho các lô
Các chức năng này được thực hiện cho các hình ảnh đơn lẻ (tức là các đai 3-D có hình dạng [chiều cao, chiều rộng, màu kênh]). Làm thế nào tôi có thể làm cho chúng hoạt động trên một loạt hình ảnh (tức là 4-D tensors với hình dạng [batch, height, width, color-channel])?
Ví dụ làm việc sẽ được đánh giá cao!
Cảm ơn nó hoạt động! Có một lý do nào đó các chức năng trong tf.image không có sẵn tính năng này? Tôi đã thực hiện tất cả các biến dạng hình ảnh của tôi trong một tiền tố chức năng đơn() được gọi từ tf.map_fn(). Tôi tin rằng điều này gây ra các biến dạng ngẫu nhiên là khác nhau cho tất cả các hình ảnh bởi vì map_fn() gọi preprocess() liên tục với các giá trị ngẫu nhiên mới. Vui lòng giải thích sự khác biệt giữa câu trả lời của bạn và câu trả lời khác được đề xuất và tại sao map_fn() là một giải pháp tốt hơn. Tôi đoán tf.map_fn() vòng qua các hình ảnh tại thời gian chạy, do đó, nó không thêm ops vào biểu đồ cho mỗi hình ảnh trong lô? – questiondude
Cảm ơn. Tôi đã làm điều này, và nó hoạt động. Nhưng đào tạo bây giờ chậm hơn 5 lần so với không có biến đổi, vì vậy nó không phải là hiệu quả :-( –