2009-11-20 40 views
11

Tôi đang tìm phương pháp phát hiện nhanh nhất và hiệu quả hơn đối tượng trong video đang chuyển động. Những điều cần lưu ý về video này: Độ phân giải rất thấp và hạt, cả nền và nền trước đều di chuyển đồng thời.Phương pháp tốt nhất để phát hiện đối tượng trong video chuyển động có độ phân giải thấp là gì?

Lưu ý: Tôi đang cố gắng phát hiện một chiếc xe tải đang di chuyển trên một con đường trong một video chuyển động.

Phương pháp tôi đã cố gắng:

Đào tạo một Haar Cascade - Tôi đã cố gắng đào tạo phân loại để xác định các đối tượng bằng cách lấy Copping nhiều hình ảnh của đối tượng mong muốn. Điều này được chứng minh là tạo ra nhiều phát hiện sai hoặc không phát hiện gì cả (đối tượng mong muốn không bao giờ được phát hiện). Tôi đã sử dụng khoảng 100 hình ảnh tích cực và 4000 âm bản.

SIFT và SURF Các điểm chính - Khi cố gắng sử dụng một trong các phương pháp này dựa trên các tính năng, tôi phát hiện ra rằng đối tượng tôi muốn phát hiện có độ phân giải quá thấp nên không có đủ tính năng để khớp chính xác phát hiện. (Đối tượng mong muốn không bao giờ được phát hiện)

So khớp mẫu - Đây có lẽ là phương pháp tốt nhất mà tôi đã thử. Đó là chính xác nhất mặc dù hầu hết các hacky của tất cả. Tôi có thể phát hiện đối tượng cho một video cụ thể bằng cách sử dụng mẫu được cắt từ video. Tuy nhiên, không có độ chính xác được đảm bảo bởi vì tất cả những gì được biết là phù hợp nhất cho mỗi khung hình, không có phân tích nào được thực hiện trên mẫu tỷ lệ phần trăm phù hợp với khung. Về cơ bản, nó chỉ hoạt động nếu đối tượng luôn ở trong video, nếu không nó sẽ tạo ra một phát hiện sai.

Vì vậy, đó là 3 phương pháp lớn mà tôi đã thử và tất cả đều thất bại. Điều gì sẽ làm việc tốt nhất là một cái gì đó giống như phù hợp với mẫu nhưng với quy mô và luân phiên bất biến (dẫn tôi đến thử SIFT/SURF), nhưng tôi không có ý tưởng làm thế nào để sửa đổi các chức năng phù hợp với mẫu.

Có ai có bất kỳ đề xuất nào về cách thực hiện tốt nhất tác vụ này không?

+2

Làm thế nào là xe tải định hướng? Hình dạng/hướng của nó có thay đổi không? Máy ảnh có thay đổi vị trí không? Đây có phải là video một lần hay một hệ thống cần phải hoạt động trong nhiều điều kiện khác nhau không? – endolith

+0

Tôi đồng ý với endolith, điều quan trọng là bạn xác định vấn đề với nhiều chi tiết hơn. Lựa chọn phương pháp sẽ ảnh hưởng đến độ bền. – Ivan

+0

Quan điểm của xe tải bên cạnh nó và nó đang di chuyển theo chiều ngang. Hình dạng của chiếc xe không thay đổi nhiều, đó là lý do tại sao mẫu khớp với công trình, nhưng tôi vẫn muốn phương pháp của tôi trở nên mạnh mẽ. Về cơ bản, máy ảnh di chuyển sang trái và sang phải, theo một vài phương tiện khác nhau, với một số xe khác đang lái xe trong quá khứ. Về cơ bản, tôi muốn điều này hoạt động trong nhiều tình huống hơn một (nhưng chủ yếu là xử lý video có chất lượng tương tự). Ít nhất tôi muốn hoàn thành là một máy dò các vật chuyển động bên trong một đoạn video chuyển động. – monky822

Trả lời

0

Chúng ta đang nói về độ phân giải thấp như thế nào? Bạn cũng có thể xây dựng trên đối tượng? Nó là một màu cụ thể? Liệu nó có một mô hình? Các câu trả lời ảnh hưởng đến những gì bạn nên sử dụng.

Ngoài ra, tôi có thể đang đọc câu lệnh khớp mẫu của bạn sai, nhưng có vẻ như bạn đang cố gắng quá tải nó (bằng cách thử nghiệm trên cùng một video bạn trích xuất đối tượng từ ??).

+0

Độ phân giải là 720x480 nhưng chất lượng của video rất kém. Video rất pixelated ở độ phân giải này. Về kết hợp mẫu, tôi không đào tạo gì cả. Tôi chỉ sử dụng một đối tượng bị cắt từ video và chỉ tìm kiếm trong từ mỗi khung hình. – monky822

+0

Vâng, bạn đang đào tạo nó, chỉ trên một bộ dữ liệu. Các mẫu sẽ phù hợp với darn tốt nếu ánh sáng và định hướng của đối tượng hầu như không thay đổi. Thời điểm đó, độ chính xác thực sự sẽ giảm xuống. Một lần nữa, hãy sử dụng tất cả các dấu hiệu bạn có thể - đặc biệt. nếu nó ở đó. – UsAaR33

0

A Haar Cascade sẽ yêu cầu dữ liệu đào tạo đáng kể về phía bạn và sẽ kém đối với bất kỳ điều chỉnh nào trong định hướng. Đặt cược tốt nhất của bạn có thể là kết hợp mẫu phù hợp với một thuật toán tương tự như camshift in opencv (5,7MB PDF), cùng với một mô hình xác suất (bạn sẽ phải tìm ra mô hình này) cho dù chiếc xe tải vẫn còn trong hình ảnh hay chưa.

2

This vehicle detection paper sử dụng một ngân hàng Gabor lọc để phát hiện mức độ thấp và sau đó sử dụng các phản ứng để tạo ra các không gian chức năng mà nó huấn luyện một SVM phân loại.

Kỹ thuật này dường như hoạt động tốt và ít nhất là bất biến quy mô. Tôi không chắc chắn về luân chuyển mặc dù.

1

Không biết ứng dụng của bạn, ấn tượng ban đầu của tôi là normalized cross-correlation, đặc biệt là vì tôi nhớ nhìn thấy một mối tương quan chéo hoàn toàn quang học có theo dõi xe như ứng dụng ví dụ.(Theo dõi một chiếc xe khi nó đi qua chỉ sử dụng các thành phần quang học và hình ảnh bên hông xe - Tôi ước tôi có thể tìm thấy liên kết.) Điều này tương tự (nếu không giống hệt) đối với "mẫu phù hợp", bạn nói loại công trình , nhưng điều này sẽ không hoạt động nếu hình ảnh được xoay, như bạn biết.

Tuy nhiên, có related method based on log-polar coordinates sẽ hoạt động bất kể xoay, chia tỷ lệ, cắt và dịch.

Tôi tưởng tượng điều này cũng sẽ cho phép theo dõi rằng đối tượng đã rời khỏi cảnh của video, vì mối tương quan tối đa sẽ giảm.

5

Áp dụng optical flow cho hình ảnh và sau đó phân đoạn dựa trên trường dòng. Lưu lượng nền rất khác với luồng "đối tượng" (chủ yếu phân kỳ hoặc hội tụ tùy thuộc vào việc nó đang di chuyển về phía hay ra khỏi bạn, với một số thành phần bên cũng).

Dưới đây là một dự án trông như già mà làm việc theo cách này:

http://users.fmrib.ox.ac.uk/~steve/asset/index.html

Các vấn đề liên quan