Tôi đang cố gắng sử dụng caffe để thực hiện tổn thất ba lần được mô tả trong Schroff, Kalenichenko and Philbin "FaceNet: A Unified Embedding for Face Recognition and Clustering", 2015.Công thức gradient truyền trở lại mất ba chiều là gì?
Tôi mới làm điều này để làm thế nào để tính toán gradient trong tuyên truyền trở lại?
Tôi thấy có một PR mở triển khai tổn thất này: https://github.com/BVLC/caffe/pull/3663 – Shai