2012-02-13 71 views
6

Tôi là một công cụ mới để nhận dạng OCR và Python.Nhận dạng hình ảnh bằng Python

Điều tôi đang cố gắng đạt được là chạy Tesseract từ tập lệnh Python để 'nhận ra' một số số liệu cụ thể trong tệp .tif.

Tôi nghĩ rằng tôi có thể thực hiện một số khóa đào tạo cho Tesseract nhưng tôi không tìm thấy bất kỳ chủ đề tương tự nào trên Google và tại đây tại SO. Về cơ bản tôi có một số .tif có chứa một số hình ảnh (như một 'mũi tên', một 'hoa' và các biểu tượng khác), và tôi muốn kịch bản để in như đầu ra tên của biểu tượng đó. Nếu nó tìm thấy một mũi tên thì in 'mũi tên'.

Có khả thi không?

+0

Bạn đã xem http://code.google.com/p/pytesser/ chưa? –

+0

Điều này có nhận ra các biểu tượng bên trong hình ảnh hoặc chỉ văn bản không? Có cách nào đào tạo nó theo như bạn biết không? – KingBOB

+0

Có nền phía sau các hình vẽ, định hướng, kích thước hoặc thay đổi màu sắc của chúng không? Chúng tôi càng có nhiều thông tin hơn, chúng tôi có thể giúp – P2bM

Trả lời

1

Đây không phải là câu trả lời hoàn chỉnh, nhưng nếu có nhiều hình ảnh trong tif và nếu bạn biết kích thước trước, bạn có thể chuẩn hóa các mẫu hình ảnh trước khi phân loại chúng. Bạn sẽ cắt hình ảnh thành tất cả các hình chữ nhật có thể có trong tif.

Vì vậy, khi bạn tạo một trình phân loại (tôi không đề cập đến các phương pháp ở đây), kết quả cuối cùng sẽ tổng hợp phân loại tất cả các hình chữ nhật nhỏ hơn. Vì vậy, nếu đưa ra một tif, hình ảnh 'mũi tên' hoặc 'hoa' là 16px x 16px, giả sử bạn có thể sử dụng Python PIL để tạo mẫu.

from PIL import Image 

image_samples = [] 

im = Image.open("input.tif") 
sample_dimensions = (16,16) 

for box in get_all_corner_combinations(im, sample_dimensions): 

    image_samples.append(im.crop(box)) 


classifier = YourClassifier() 

classifications = [] 

for sample in image_samples: 
    classifications.append (classifier (sample)) 

label = fuse_classifications (classifications) 

Một lần nữa, tôi không nói về bước học thực tế viết YourClassifier. Nhưng hy vọng điều này sẽ giúp giải quyết một phần vấn đề.

Có rất nhiều nghiên cứu về chủ đề học tập để phân loại hình ảnh cũng như làm việc trong việc dọn dẹp tạp âm trong hình ảnh trước khi phân loại chúng.

Xem xét duyệt qua bộ sưu tập tốt đẹp này của các thư viện học tập máy Python hiện có.

http://scipy-lectures.github.com/advanced/scikit-learn/index.html

Có nhiều kỹ thuật liên quan đến hình ảnh.

Các vấn đề liên quan