2010-07-29 34 views
16

Tôi không hiểu hạt nhân convolution là gì và cách tôi sẽ áp dụng ma trận convolution cho các điểm ảnh trong một hình ảnh (tôi đang nói về việc thực hiện thao tác Gaussian Blur trên hình ảnh).Gaussian blur và convolution kernel

Tôi cũng có thể giải thích cách tạo hạt nhân cho thao tác Gaussian Blur?

Tôi đọc this article nhưng tôi dường như không thể hiểu được cách làm việc ...

Nhờ ai mất thời gian để giải thích điều này với tôi :),

ExtremeCoder

Trả lời

17

Các cơ bản ý tưởng là các điểm ảnh mới của hình ảnh được tạo ra bởi trọng số trung bình của các pixel gần với nó (tưởng tượng vẽ một vòng tròn xung quanh pixel).

Đối với mỗi pixel trong hình ảnh bạn sẽ tạo một hình vuông nhỏ xung quanh pixel. Giả sử bạn lấy 8 hàng xóm bên cạnh một pixel (bao gồm cả đường chéo mặc dù không quan trọng ở đây), và chúng tôi thực hiện một trung bình có trọng số để có được điểm ảnh giữa.

Trong trường hợp mờ Gaussian, nó chia nhỏ thành hai thao tác một chiều. Đối với mỗi pixel, hãy lấy một số lượng pixel bên cạnh pixel chỉ theo hướng hàng. Nhân các giá trị pixel thời gian các trọng số tính từ phân phối Gaussian (hoặc nếu bạn đang làm điều này cho một hiệu ứng hình ảnh và không phải vì một lý do khoa học, trọng lượng có thể bất cứ điều gì có vẻ tốt) và tổng hợp chúng. Một cách khác để xem xét nó là pixel tạo ra một véc-tơ và các trọng số tạo ra một véc-tơ và bạn đang lấy sản phẩm chấm. Lặp lại quá trình này theo hướng cột như một đường chuyền riêng biệt.

10

Một hạt nhân chập là ma trận các giá trị chỉ định cách vùng lân cận của pixel đóng góp vào trạng thái của pixel đó trong hình ảnh cuối cùng. Có một mô tả công bằng về những điều cơ bản here. Một gaussian blur là một hàm convolution sử dụng một chức năng thực sự xấu xí (bạn đã thấy trang wikipedia) để tính toán một hạt nhân chập để vượt qua hình ảnh. Bạn sẽ tìm thấy một hạt nhân ví dụ cho một gaussian trong trang wikipedia đó.

Điểm của tất cả các phép tính trong đó là tạo ra một hiệu ứng mờ ảo tương tự như mẫu phân tán được tạo ra bởi màn hình lưới đặt giữa trình xem và hình ảnh. Bạn có thể nghĩ về 'kích thước' (độ lệch chuẩn) của gaussian như liên quan đến khoảng cách giữa hình ảnh và màn hình.