Tôi đã hy vọng một người nào đó có thể cho tôi biết tại sao Tesseract của tôi gặp khó khăn khi nhận ra một số hình ảnh có chữ số và nếu có điều gì đó tôi có thể làm. Mọi thứ đang hoạt động theo thử nghiệm, và vì nó chỉ là chữ số tôi cần, tôi nghĩ tôi có thể quản lý với mẫu tiếng Anh cho đến khi tôi phải bắt đầu với màn hình 7segmented.Khó nhận dạng chữ số trong Tesseract - android
Mặc dù tôi gặp nhiều rắc rối với hình ảnh được thêm vào, tôi muốn biết liệu tôi có nên bắt đầu làm việc trên các thuật toán nhận dạng của riêng mình hay không. có ai biết giới hạn của Tesseract ở đâu không?
những điều đã thử: cố gắng đặt psm thành one_line, one_word, one_char (và cắt hình ảnh). Với one_line và one_word không có thay đổi đáng kể. với one_char nó đã nhận ra một chút tốt hơn, nhưng đôi khi, do khoảng cách lớn nó gắn thêm một số cho nó, mà sau đó hơi say nó lên, nếu bạn nhìn vào hình ảnh đính kèm sau đó nó dẫn đến 04. Tôi cũng đã cố gắng để tự thực hiện việc binarization, điều này dẫn đến sự công nhận kém hơn và rất tiêu thụ tài nguyên. Tôi đã cố gắng đảo ngược hình ảnh, điều này không tạo ra sự khác biệt nào cho tesseract.
Tôi đã đính kèm những hình ảnh tôi cần, trong số những thứ khác, để được xử lý.
Giải thích về những hình ảnh:
là một hình ảnh mà Tesseract không gặp khó khăn nhận ra, mặc dù nó đã được thực hiện bằng lời nói cho các tiện nghi của việc xây dựng một ứng dụng xung quanh một hình ảnh làm việc.
là hình ảnh thực tế khớp với image_seven. Nhưng nó không thể nhận ra điều này.
là một hình ảnh khác tôi muốn nó nhận ra, và có tôi biết nó không thể được skrewed, và tôi đã unskrew (nghĩ rằng skrew là thuật ngữ ở đây == "straighting") nó khi thử nghiệm.
skrew = skew nice :). Ngoài ra, bộ công cụ hình ảnh có thể giảm tiếng ồn, làm sắc nét, và những gì không. Điều đó có thể giúp –