2013-05-12 34 views
6

Tôi đang tìm phần mềm OCR hiển thị lớp phủ HTML cho hình ảnh. Tôi hiện đang sử dụng một số sản phẩm chưa được đặt tên. Nó có chức năng OCR, sẽ làm một OCR nội tuyến của một tài liệu PDF có hình ảnh.OCR cung cấp lớp phủ HTML cho hình ảnh?

OCR nội tuyến rất tiện dụng, nó cho phép tìm kiếm tài liệu PDF với hình ảnh cho văn bản. Ngoài ra văn bản có thể được đánh dấu trực tiếp trong tài liệu, văn bản OCR được căn chỉnh với hình ảnh cơ bản. Thật không may tôi có thể neiter xuất khẩu và cũng không lưu trữ OCR nội tuyến từ bên trong sản phẩm chưa đặt tên.

Có một số phần mềm khác có thể thực hiện và xuất OCR nội tuyến không? Tôi sẽ đặc biệt quan tâm đến việc xuất khẩu sang HTML bao gồm các đoạn văn được định vị phù hợp với hình ảnh bên dưới.

Xem thêm:
https://stackoverflow.com/questions/11404805/ocr-and-the-location-of-the-image-where-the-scanned-document-came-from

+0

Tôi cũng quan tâm đến vấn đề này. (Tôi giả định "không tên" có nghĩa là nó là độc quyền, không phải là bạn không biết nó là gì). Bạn đang đào tạo OCR hay bạn giả sử nó sẽ diễn giải dựa vào một bộ ký tự đã cho. Shapecatcher.com sẽ giúp bạn - nó chạy bitmap chống lại một bộ tiêu chuẩn Unicode glyph? –

+0

Cảm ơn. Tôi đang tạo ra một giải pháp OpenSource hoàn toàn để trích xuất thông tin (bitbucket.org/petermr/pdf2svg-dev và bitbucket.org/petermr/svg2xml-devfrom PDF nhưng vẫn chưa thực hiện rất nhiều trên phần hình ảnh/OCR. địa chỉ ANSI trước, nhưng đừng nín thở. –

Trả lời

1

Tôi có một giải pháp khả thi cho bạn. Nhưng, giải pháp đặc biệt này có một số nhược điểm, có thể cản trở bạn kết thúc mục tiêu.

Đầu chuyển đổi tập tin ảnh ở sang pdf: http://finereader.abbyyonline.com Sau đó, chuyển đổi PDF sang HTML tại http://document.online-convert.com/convert-to-html

Giải pháp này làm việc cho điều về kích thước của giấy, và kết quả cuối cùng có html với lớp ảnh, Nếu tất cả những gì bạn muốn là html với định dạng hình ảnh chỉ làm cho hình ảnh hoàn toàn trong suốt.

Các vấn đề liên quan