Tôi là người mới cho tensorflow và tôi bắt đầu với mã ví dụ MNIST chính thức để tìm hiểu logic của tensorflow. Tuy nhiên, một điều tôi cảm thấy không tốt là, ví dụ MNIST cung cấp tập dữ liệu gốc như một số tệp nén, định dạng của nó không rõ ràng cho người mới bắt đầu. Trường hợp này cũng đi với Cifar10 cung cấp tập dữ liệu dưới dạng tệp nhị phân. Tôi nghĩ trong nhiệm vụ học tập sâu sắc thực tế, tập dữ liệu của chúng tôi có thể có nhiều tệp hình ảnh, chẳng hạn như *.jpg
hoặc *.png
trong một thư mục và chúng tôi cũng có tệp văn bản ghi nhãn của từng tệp (như tập dữ liệu ImageNet). Hãy để tôi sử dụng MNIST làm ví dụ.Tải các tệp hình ảnh trong thư mục dưới dạng tập dữ liệu để đào tạo trong Tensorflow
MNIST chứa 50k hình ảnh đào tạo có kích thước 28 x 28
. Bây giờ, hãy giả sử những hình ảnh này có định dạng jpg và được lưu trữ trong một thư mục ./dataset/
. Trong ./dataset/
, chúng ta có một tập tin văn bản label.txt
lưu trữ các nhãn của mỗi hình ảnh:
/path/to/dataset/
image00001.jpg
image00002.jpg
... ... ... ...
image50000.jpg
label.txt
nơi label.txt
là như thế này:
#label.txt:
image00001.jpg 1
image00002.jpg 0
image00003.jpg 4
image00004.jpg 9
... ... ... ...
image50000.jpg 3
Bây giờ tôi muốn sử dụng Tensorflow để đào tạo một mô hình lớp duy nhất với các tập dữ liệu này. Bất cứ ai có thể giúp đỡ để cung cấp cho một đoạn mã đơn giản để làm điều đó?