Làm thế nào để bạn OCR tệp tiff sử dụng giao diện Tesseract trong C#?
Hiện tại tôi chỉ biết cách thực hiện bằng cách sử dụng tệp thực thi.OCR với giao diện Tesseract
Trả lời
Mã nguồn dường như được hướng đến một tệp thực thi, bạn có thể cần phải viết lại các nội dung một chút để nó có thể tạo thành một tệp DLL thay thế. Tôi không có nhiều kinh nghiệm với Visual C++ nhưng tôi nghĩ rằng nó không phải là quá khó với một số nghiên cứu. Tôi đoán là có thể ai đó đã tạo phiên bản thư viện rồi, bạn nên dùng thử Google.
Khi bạn có mã tesseract-ocr trong một tệp DLL, bạn có thể nhập tệp vào dự án C# của mình qua Visual Studio và tạo lớp bao bọc và thực hiện tất cả các công cụ marshaling cho bạn. Nếu bạn không thể nhập thì DllImport sẽ cho phép bạn gọi các hàm trong DLL từ mã C#.
Sau đó, bạn có thể xem xét tệp thực thi ban đầu để tìm manh mối về hàm nào cần gọi đến đúng OCR hình ảnh tiff.
Hãy xem tessnet
Điều này tốt hơn P/Tự gọi nó. –
+1 - Hoạt động khá tốt và bạn quên mất DllImports –
Disclaimer: Tôi làm việc cho Atalasoft
OCR module supports Tesseract của chúng tôi và nếu điều đó tỏ ra không đủ tốt, bạn có thể nâng cấp lên động cơ tốt hơn và chỉ cần thay đổi một dòng mã (chúng tôi cung cấp một giao diện chung cho nhiều công cụ OCR).
Chương trình C# khởi chạy tesseract.exe và sau đó đọc tệp đầu ra của tesseract.exe.
Process process = Process.Start("tesseract.exe", "out");
process.WaitForExit();
if (process.ExitCode == 0)
{
string content = File.ReadAllText("out.txt");
}
Tôi phát hiện hôm nay rằng EMGU hiện bao gồm trình bao bọc Tesseract. Trong khi số lượng dlls không được quản lý của lib opencv có vẻ hơi khó khăn, thì không có gì là một bản sao nhanh vào thư mục đầu ra của bạn sẽ không chữa được. Từ đó quá trình OCR thực tế cũng đơn giản như ba dòng:
Tesseract ocr = new Tesseract(Path.Combine(Environment.CurrentDirectory, "tessdata"), "eng", Tesseract.OcrEngineMode.OEM_TESSERACT_ONLY);
this.ocr.Recognize(clip);
optOCR.Text = this.ocr.GetText();
"robomatics" đặt cùng a very nice youtube video thể hiện một giải pháp đơn giản nhưng hiệu quả.
- 1. Tesseract 3 (OCR) - .NET Wrapper
- 2. Tesseract OCR Thư viện - Học Font
- 3. Tesseract (động cơ OCR) có reentrant không?
- 4. Động cơ OCR nào tốt hơn: Tesseract hoặc OCRopus?
- 5. Nhận dạng ký tự tiếng Trung bằng Tesseract OCR
- 6. 7-Segment Display OCR
- 7. Giao diện gọn gàng với giao diện MATLAB với mlabwrap
- 8. Đặt rõ ràng phông chữ được sử dụng để nhận dạng bởi Tesseract-OCR
- 9. Lỗi chạy Tesseract
- 10. Lỗi Python khi nhập image_to_string từ tesseract
- 11. OpenCV 2.4.4 và Tesseract 3.02.02 Đừng liên kết với nhau
- 12. Tesseract Ví dụ cho Iphone
- 13. Từ điển tùy chỉnh cho Tesseract
- 14. C# generics với giao diện
- 15. Giao diện MDI với FireMonkey
- 16. Làm thế nào để tìm thấy các thông số được hỗ trợ trong tập tin cấu hình Tesseract OCR
- 17. OCR cho bản nhạc
- 18. C++ Nhiều kế thừa với giao diện?
- 19. Delphi với giao diện HTML/CSS
- 20. Fluent NHibernate, làm việc với giao diện
- 21. thư viện C++ với giao diện c
- 22. Giao diện Android với kết nối Ethernet
- 23. Giao diện máy chủ web với PHP
- 24. Giao diện người dùng Kendo với backbonejs
- 25. Generics với giao diện trong F #
- 26. Trang trí giao diện chung với Structuremap
- 27. Giải quyết giao diện chung với Autofac
- 28. Giao diện nguồn với Python và urllib2
- 29. Giao diện quãng tám với C#
- 30. OCR nguồn mở cho Trung Quốc
bạn có thể vui lòng hướng dẫn tôi cách bạn quản lý để sử dụng Tesseract trong C#? – mouthpiec
bất kỳ mã mẫu nào? – Kiquenet