Đây không phải là câu trả lời hoàn chỉnh, nhưng nếu có nhiều hình ảnh trong tif và nếu bạn biết kích thước trước, bạn có thể chuẩn hóa các mẫu hình ảnh trước khi phân loại chúng. Bạn sẽ cắt hình ảnh thành tất cả các hình chữ nhật có thể có trong tif.
Vì vậy, khi bạn tạo một trình phân loại (tôi không đề cập đến các phương pháp ở đây), kết quả cuối cùng sẽ tổng hợp phân loại tất cả các hình chữ nhật nhỏ hơn. Vì vậy, nếu đưa ra một tif, hình ảnh 'mũi tên' hoặc 'hoa' là 16px x 16px, giả sử bạn có thể sử dụng Python PIL để tạo mẫu.
from PIL import Image
image_samples = []
im = Image.open("input.tif")
sample_dimensions = (16,16)
for box in get_all_corner_combinations(im, sample_dimensions):
image_samples.append(im.crop(box))
classifier = YourClassifier()
classifications = []
for sample in image_samples:
classifications.append (classifier (sample))
label = fuse_classifications (classifications)
Một lần nữa, tôi không nói về bước học thực tế viết YourClassifier
. Nhưng hy vọng điều này sẽ giúp giải quyết một phần vấn đề.
Có rất nhiều nghiên cứu về chủ đề học tập để phân loại hình ảnh cũng như làm việc trong việc dọn dẹp tạp âm trong hình ảnh trước khi phân loại chúng.
Xem xét duyệt qua bộ sưu tập tốt đẹp này của các thư viện học tập máy Python hiện có.
http://scipy-lectures.github.com/advanced/scikit-learn/index.html
Có nhiều kỹ thuật liên quan đến hình ảnh.
Bạn đã xem http://code.google.com/p/pytesser/ chưa? –
Điều này có nhận ra các biểu tượng bên trong hình ảnh hoặc chỉ văn bản không? Có cách nào đào tạo nó theo như bạn biết không? – KingBOB
Có nền phía sau các hình vẽ, định hướng, kích thước hoặc thay đổi màu sắc của chúng không? Chúng tôi càng có nhiều thông tin hơn, chúng tôi có thể giúp – P2bM