Nhiều phân loại, trong số đó là tuyến tính Support Vector Machine (SVM), chỉ có thể giải quyết các sự cố có thể phân tách tuyến tính, tức là các điểm thuộc loại 1 có thể được tách ra khỏi các điểm thuộc lớp 2 bằng siêu kết nối.
Trong nhiều trường hợp, một vấn đề không tách rời tuyến tính có thể được giải quyết bằng cách áp dụng biến đổi phi() cho các điểm dữ liệu; biến đổi này được cho là biến đổi các điểm thành không gian tính năng . Hy vọng là, trong không gian tính năng, các điểm sẽ được tách biệt tuyến tính. (Lưu ý: Đây chưa phải là mẹo hạt nhân ... hãy chú ý theo dõi.)
Có thể chỉ ra rằng, kích thước của không gian tính năng càng cao thì số lượng sự cố có thể phân tách tuyến tính trong không gian đó càng lớn. Do đó, một lý tưởng sẽ muốn không gian tính năng trở nên cao nhất có thể.
Thật không may, vì kích thước của không gian tính năng tăng lên, do đó, số lượng tính toán được yêu cầu. Nhiều thuật toán học máy (trong số đó là SVM) có thể được xây dựng theo cách mà hoạt động duy nhất chúng thực hiện trên các điểm dữ liệu là một sản phẩm vô hướng giữa hai điểm dữ liệu. (. Tôi sẽ biểu thị một sản phẩm vô hướng giữa x1 và x2 bởi <x1, x2>
)
Nếu chúng ta chuyển đổi điểm của chúng tôi để đặc trưng không gian, các sản phẩm vô hướng bây giờ trông như thế này:
<phi(x1), phi(x2)>
Sự thấu hiểu mấu chốt là tồn tại một lớp chức năng được gọi là hạt nhân có thể được sử dụng để tối ưu hóa tính toán của sản phẩm vô hướng này. Một hạt nhân là một hàm K(x1, x2)
có những tài sản mà
K(x1, x2) = <phi(x1), phi(x2)>
đối với một số chức năng phi(). Nói cách khác: Chúng ta có thể đánh giá sản phẩm vô hướng trong không gian dữ liệu chiều thấp (nơi x1 và x2 "sống") mà không phải chuyển sang không gian tính năng chiều cao (nơi phi (x1) và phi (x2) "sống ") - nhưng chúng tôi vẫn nhận được lợi ích của việc chuyển đổi sang không gian tính năng chiều cao. Đây được gọi là thủ thuật hạt nhân .
Nhiều hạt nhân phổ biến, chẳng hạn như Gaussian kernel, thực sự tương ứng với biến phi() biến đổi thành không gian tính năng infinte-chiều. Thủ thuật hạt nhân cho phép chúng tôi tính toán các sản phẩm vô hướng trong không gian này mà không cần phải đại diện cho các điểm trong không gian này một cách rõ ràng (điều này rõ ràng là không thể đối với các máy tính có số lượng bộ nhớ hữu hạn).
+1, giải thích tốt đẹp. –
+1 - thực sự rất hay. – duffymo