2010-09-02 35 views
8

im tìm kiếm một lib OCR, có thể được tham số hóa bằng phông chữ, vì tôi luôn biết và tôi tin rằng kết quả nhận dạng sẽ tốt hơn rất nhiều theo cách này.OCR cho phông chữ đã biết

Có ai biết không?

+0

Bạn có yêu cầu phông chữ nào để sử dụng cho OCR hoặc thư viện OCR để nhận dạng phông chữ đã biết không? – t0mm13b

+4

@ tommieb75: Tôi nghĩ anh ấy rõ ràng nói anh ấy đang tìm kiếm thư viện ... –

+0

@Matti: ok ... đó là từ ngữ của câu hỏi wrt "paramterized with a font" mà tôi không hiểu ... – t0mm13b

Trả lời

2

Khám phá OCRopus. Đó là nguồn mở và được tài trợ bởi Google :) Tôi không chắc liệu nó có cho phép chọn một phông chữ cụ thể hay không, nhưng dường như nó tạo ra kết quả tốt bất kể.

2

Hầu hết các công cụ OCR sẽ xử lý tình huống này khá tốt. Trong thực tế, các công cụ OCR không bị lẫn lộn nếu chỉ có một phông chữ để nhận ra trên một trang. Lạ lùng nhưng đúng theo kinh nghiệm của tôi.

Nếu động cơ OCR có thể đọc phông chữ của bạn ngay từ đầu thì tôi sẽ chỉ sử dụng và không lo lắng về nó. Có các tùy chọn tốt hơn để chọn để cải thiện khả năng nhận dạng.

Nhiều công cụ OCR cho phép bạn thiết lập một số thông số nhận dạng để giúp cải thiện khả năng nhận dạng như chiều rộng cố định hoặc tỷ lệ, serif hoặc không serif, máy hoặc in tay. Bạn cũng có thể chọn một tập con gồm các ký tự như chữ hoa hoặc số để cải thiện đáng kể kết quả. I E. nếu bạn chỉ có các ký tự số thì ký tự 0 (Zero) không bao giờ bị lẫn lộn với 'O' hoặc 'o' hoặc 'Ø'. Bạn sẽ tìm thấy các gợi ý này sẽ hiệu quả hơn lựa chọn có thể chọn kiểu phông chữ chính xác cho OCR.

Các công cụ khác sẽ cho phép bạn đào tạo động cơ OCR để xử lý phông chữ mới và điều này sẽ giúp ích đáng kể nếu bạn có phông chữ lạ.

Nếu chất lượng hình ảnh của bạn tốt và phông chữ của bạn sạch sẽ và có kích thước phù hợp thì tôi khuyên bạn nên sử dụng Tesseract OCR từ Google và OCROpus là suggested by Michael Mior. Nó hoàn toàn miễn phí và hoạt động tốt trên văn bản rõ ràng và rõ ràng. Nếu văn bản là một chút khó khăn thì chắc chắn có những công cụ OCR tốt hơn như ABBYY, Prime Recognition, Omnipage và nhiều công cụ khác mặc dù chúng sẽ tốn tiền.

Các vấn đề liên quan