2009-03-23 35 views
22

Tôi đang xem xét thực hiện một dự án nhỏ như một phần của các bậc thầy của tôi để làm ocr chỉ cho sheetmusic thay vì văn bản.OCR cho bản nhạc

Tôi nghĩ PIL và Python sẽ tốt cho chứng minh đơn giản về khái niệm "ghi chú" R.

Câu hỏi của tôi là: Có ai có bất kỳ "không làm điều đó với PIL sử dụng xyz thay thế" hoặc một cái gì đó trong hẻm đó?

EDIT: liên kết delicius tôi về vấn đề này nếu có ai quan tâm: http://delicious.com/seet/DIKU-09b4%2Bb1

============================ =============================================

EDIT2 :

Hiện tại, tôi biết nhiều hơn về OCR cho bản nhạc hoặc OMR khi được gọi.

Trong học viện, khu vực đã được nghiên cứu từ cuối 60/đầu 70 và xây dựng hệ thống OMR không phải là một nhiệm vụ đơn giản. Để có được một bản tóm tắt của các vấn đề và nghiên cứu cho đến đầu năm 2000, bạn có thể đọc "The challenge of Optical Music Recognition" mà là khá thành công trong việc vẽ lên các dòng của lĩnh vực này.

Về phần mềm hiện tại tôi biết ít nhất sau đây:

Và các bài kiểm tra không khoa học của tôi đã cho tôi ý tưởng rằng photoscore là thứ mạnh mẽ nhất.

Đối với phần mềm nguồn mở Audiveris là điều hoàn chỉnh duy nhất tôi tìm thấy và được viết bằng Java.

Về câu hỏi ban đầu của tôi, tôi đang sử dụng Gamera. Gamera là một công cụ mã nguồn mở để phân tích hình ảnh tài liệu, cung cấp các công cụ để thực hiện tất cả các công cụ cơ bản cần thiết để phân tích hình ảnh để nhận dạng. Gamera có giao diện python và khả năng viết C++ "bộ công cụ". Ví dụ: có thể là download and use a staffline removal toolkit for gamera.

+1

Hãy nghĩ rằng phản đối duy nhất sẽ là hiệu suất, điều này không quan trọng đối với một dự án học thuật. –

+0

Mọi cập nhật hoặc đề xuất? – dassouki

+0

"Cảm giác" của tôi về công cụ thương mại tốt nhất là Photoscore – svrist

Trả lời

10

Dự án của tôi đã kết thúc bằng một báo cáo và một số phần mềm python. Tìm nó ở đây:

Các ý chính của nó là: Thật khó có thể làm OMR tốt và mất rất nhiều công sức. Tôi không có thời gian để hoàn thành OMR (và có vẻ như nó không cần thiết sau khi tất cả).

Tôi đã triển khai một công cụ có thể thực hiện tiền xử lý bản nhạc trước khi giao cho công cụ OMR như Photoscore hoặc tương tự. Việc xử lý trước bao gồm xóa lời bài hát và động lực vì không cần thông tin này để phân tích thống kê âm nhạc trong các tập đoàn âm nhạc lớn

+1

Liên kết này không còn giá trị, nhưng tôi tin rằng mã nói trên bây giờ là ở đây: https://github.com/svrist/preomr –

+0

Thật vậy. Cảm ơn những người đứng đầu lên – svrist

+0

Liên kết "Báo cáo" không còn hợp lệ nữa. Nó đã được hợp lệ một thời gian trước đây, nhưng bây giờ nó không phải là. Bạn có thể cập nhật nó không? – Manu

2

Bạn có thể quan tâm đến việc đóng góp cho this project. Khác hơn thế, tốt nhất của may mắn với các bậc thầy của bạn.

2

http://www.musitek.com/ có các dịch vụ thương mại - bạn có thể xem hướng dẫn sử dụng và thông số kỹ thuật khác để biết một số gợi ý về cách tiến hành.