Tôi đang nhận dạng đơn giản các chữ cái và chữ số với các mạng thần kinh. Cho đến bây giờ tôi đã sử dụng mọi pixel của hình ảnh chữ cái làm đầu vào cho mạng. Không cần phải nói cách tiếp cận này tạo ra các mạng rất lớn. Vì vậy, tôi muốn trích xuất các tính năng từ hình ảnh của tôi và sử dụng chúng làm đầu vào cho các NN. Câu hỏi đầu tiên của tôi là những gì thuộc tính của các chữ cái là tốt cho việc nhận ra chúng. Câu hỏi thứ hai là cách thể hiện các tính năng này như đầu vào cho mạng thần kinh. Ví dụ, tôi có thể đã phát hiện tất cả các góc trong các chữ cái và có chúng như là một vector của (x, y) điểm. Làm thế nào để chuyển đổi vector này thành một cái gì đó phù hợp cho một NN (như các kích thước vector có thể khác nhau cho các chữ cái khác nhau).Trích xuất tính năng từ các mạng thần kinh
Trả lời
Rất nhiều người đã sử dụng nhiều tính năng cho OCR. Đơn giản nhất trong số đó là tất nhiên, chuyển trực tiếp các giá trị pixel.
Có dữ liệu nhận dạng chữ trong các mẫu OpenCV, được trích xuất từ tập dữ liệu UCI. Nó sử dụng khoảng 16 tính năng khác nhau. Kiểm tra SOF này: How to create data fom image like "Letter Image Recognition Dataset" from UCI
Bạn cũng có thể xem bài viết giải thích điều này trong một câu trả lời của nó. Bạn có thể nhận được nó bằng cách googling.
Bạn cũng có thể quan tâm đến this PPT. Nó đưa ra một giải thích ngắn gọn về các kỹ thuật khai thác tính năng khác nhau được sử dụng ngày nay.
Bài viết này, Introduction to Artificial Intelligence. OCR using Artificial Neural Networks by Kluever (2008) cho một khảo sát gồm 4 tính năng kỹ thuật trích xuất cho OCR sử dụng mạng nơron. Ông mô tả các phương pháp sau:
- Mã hóa độ dài chạy (RLE): Bạn cần hình ảnh nhị phân cho điều này (nghĩa là, chỉ trắng hoặc đen). Chuỗi nhị phân có thể được mã hóa thành một biểu diễn nhỏ hơn.
- Phát hiện cạnh: Tìm các cạnh. Bạn có thể khá thô lỗ với điều này, vì vậy thay vì trả về các tọa độ chính xác (x, y) bạn có thể giảm ma trận bằng cách chỉ đếm nếu cạnh đó xảy ra ở các vị trí bị giảm (ví dụ, trên 20%, 40%, 60 & và 80 % của hình ảnh).
- Đếm 'Điểm ảnh thực sự': Điều này làm giảm thứ nguyên từ
width * height
ma trận hình ảnh thànhwidth + height
. Bạn sử dụng véc tơwidth
vàheight
làm đầu vào riêng biệt. - Nhập bằng ma trận cơ bản: Bạn đã thử điều này; Nhập toàn bộ ma trận cho kết quả tốt, nhưng khi bạn nhận thấy có thể dẫn đến chiều cao và thời gian đào tạo cao. Bạn có thể thử nghiệm với việc giảm kích thước hình ảnh của bạn (ví dụ: từ 200x200 đến 50x50).
Nếu bạn có vectơ đầu vào chiều rất cao, thì tôi khuyên bạn nên áp dụng phân tích thành phần chính (PCA) để loại bỏ các tính năng dư thừa và giảm kích thước của vector đối tượng.
- 1. Tạo mẫu mạng thần kinh
- 2. Mạng thần kinh huấn luyện trong Ruby
- 3. Mạng thần kinh trong Haskell - lời khuyên
- 4. Trợ giúp với mạng thần kinh Neuroph
- 5. Mạng thần kinh 0 vs -1
- 6. Bắt đầu với mạng thần kinh (ANN)?
- 7. Mạng thần kinh liên kết - Cách nhận bản đồ tính năng?
- 8. mạng thần kinh không thể tìm ra biến đổi Fourier?
- 9. mạng thần kinh để phát hiện thư rác email
- 10. Cách nhập hình ảnh vào mạng thần kinh?
- 11. Tập dữ liệu cho đào tạo mạng thần kinh
- 12. Dự báo thời tiết sử dụng mạng thần kinh
- 13. Mạng thần kinh Pybrain không huấn luyện chính xác
- 14. Mối quan hệ giữa mạng bay và mạng thần kinh là gì?
- 15. Lưới thần kinh cho ruby
- 16. tính năng trích xuất matlab trong matfile
- 17. Tìm kiếm chủ đề thú vị từ khu vực mạng thần kinh
- 18. Sự khác biệt giữa lựa chọn tính năng, trích xuất tính năng, trọng số tính năng
- 19. Làm thế nào để cập nhật sự thiên vị trong mạng ngược dòng thần kinh?
- 20. Làm thế nào để lập trình một mạng thần kinh cho cờ vua?
- 21. Trích xuất VBA từ bảng tính Excel
- 22. Phát hiện quảng cáo chiêu hàng bằng cách sử dụng mạng thần kinh
- 23. xử lý chuỗi văn bản cho đầu vào mạng thần kinh
- 24. Hỗ trợ Máy Vector hoặc Mạng Thần kinh Nhân tạo để xử lý văn bản?
- 25. Trích xuất tọa độ tính năng từ SpatialPolygons và các lớp sp khác
- 26. Thực hiện trích xuất tính năng HOG nhanh nhất?
- 27. Làm thế nào tôi có thể tính toán hoặc theo dõi việc đào tạo mạng thần kinh trong pybrain?
- 28. Làm thế nào để mã hóa một mạng thần kinh nhân tạo (Tic-tac-toe)?
- 29. Tại sao chúng ta phải chuẩn hóa đầu vào cho mạng thần kinh nhân tạo?
- 30. bộ hình ảnh đào tạo cho một mạng lưới thần kinh đơn giản