Tôi có nhóm các hình ảnh rất nhỏ (w: 70-100; h: 12-20), như hình dưới đây: Tesseract OCR-(3.02) chính xác nhận dạng và tốc độ
Trong những hình ảnh không có gì nhưng biệt danh của thành viên trong nhóm. Tôi muốn đọc văn bản từ những hình ảnh đơn giản, tất cả đều có một nền tảng, chỉ có nickname khác nhau. Vì vậy, những gì tôi đã thực hiện với hình ảnh đó:
Tôi đang sử dụng mã dưới đây để có được văn bản từ hình ảnh thứ hai:tesseract::TessBaseAPI ocr;
ocr.Init(NULL, "eng");
PIX* pix = pixRead("D:\\image.png");
ocr.SetImage(pix);
std::string result = ocr.GetUTF8Text();
tôi có 2 vấn đề với điều đó :
ocr.GetUTF8Text();
đang hoạt động chậm: 650-750ms. Hình ảnh nhỏ, tại sao nó hoạt động quá lâu?- Từ hình trên tôi nhận được kết quả như: "iwillkillsm", "iwillkillsel" vv. Hình ảnh đó rất đơn giản và tôi tin rằng rất kinh nghiệm tesseract có thể nhận ra nó với độ chính xác 100%. Tôi nên làm gì với hình ảnh/mã hoặc tôi nên đọc (và ở đâu) về tesseract-ocr (điều gì đó về tốc độ văn bản và nhận dạng chất lượng) để giải quyết những vấn đề đó?
Tôi có may mắn nhất với tesseract khi tôi tăng kích thước của hình ảnh một cách đáng kể. – nlloyd
@nlloyd Sau khi tăng kích thước, tôi có một số kết quả tốt hơn (tốc độ & độ chính xác), cảm ơn bạn! Nhưng tôi phải hỏi: liệu có ổn không, sau khi thay đổi kích thước, tôi có một số điểm ảnh màu xám hoặc gần như đen trong hình ảnh? Tình huống đó giúp tesseract hay không? –
có vẻ ổn với tôi. tôi luôn làm cho hình ảnh lớn hơn trước khi cho chúng ăn tesseract; có một giới hạn về mức độ lớn mà bạn có thể tạo ra trước khi bạn bắt đầu nhận được kết quả tồi tệ hơn tuy nhiên :) – nlloyd