Tôi đang tìm phần mềm OCR hiển thị lớp phủ HTML cho hình ảnh. Tôi hiện đang sử dụng một số sản phẩm chưa được đặt tên. Nó có chức năng OCR, sẽ làm một OCR nội tuyến của một tài liệu PDF có hình ảnh.OCR cung cấp lớp phủ HTML cho hình ảnh?
OCR nội tuyến rất tiện dụng, nó cho phép tìm kiếm tài liệu PDF với hình ảnh cho văn bản. Ngoài ra văn bản có thể được đánh dấu trực tiếp trong tài liệu, văn bản OCR được căn chỉnh với hình ảnh cơ bản. Thật không may tôi có thể neiter xuất khẩu và cũng không lưu trữ OCR nội tuyến từ bên trong sản phẩm chưa đặt tên.
Có một số phần mềm khác có thể thực hiện và xuất OCR nội tuyến không? Tôi sẽ đặc biệt quan tâm đến việc xuất khẩu sang HTML bao gồm các đoạn văn được định vị phù hợp với hình ảnh bên dưới.
Tôi cũng quan tâm đến vấn đề này. (Tôi giả định "không tên" có nghĩa là nó là độc quyền, không phải là bạn không biết nó là gì). Bạn đang đào tạo OCR hay bạn giả sử nó sẽ diễn giải dựa vào một bộ ký tự đã cho. Shapecatcher.com sẽ giúp bạn - nó chạy bitmap chống lại một bộ tiêu chuẩn Unicode glyph? –
Cảm ơn. Tôi đang tạo ra một giải pháp OpenSource hoàn toàn để trích xuất thông tin (bitbucket.org/petermr/pdf2svg-dev và bitbucket.org/petermr/svg2xml-devfrom PDF nhưng vẫn chưa thực hiện rất nhiều trên phần hình ảnh/OCR. địa chỉ ANSI trước, nhưng đừng nín thở. –