Đây là vấn đề gia cố trong đó đầu ra của mạng nơron là các phím trên bàn phím được nhấn để tối đa hóa điểm do chức năng thể dục cung cấp. Sử dụng các thuật toán di truyền (GA) và bắt đầu từ một kiến trúc mạng nơron ban đầu, GA có xu hướng tìm một kiến trúc tốt hơn để tối đa hóa một hàm thể dục, lặp lại. GA tạo ra các kiến trúc khác nhau bằng cách sinh ra một quần thể của chúng và sau đó sử dụng chúng cho nhiệm vụ (chơi trò chơi), chọn ra một điểm số cao hơn (sử dụng chức năng thể dục). Lần sau, GA sử dụng các ứng cử viên kiến trúc tốt nhất (cha mẹ trong thuật ngữ GA) để sử dụng cho chăn nuôi và lặp lại quá trình tạo ra dân số mới (kiến trúc). Tất nhiên, chăn nuôi cũng bao gồm đột biến.
Quy trình này tiếp tục cho đến khi đáp ứng tiêu chí chấm dứt (giá trị cụ thể cho chức năng thể dục hoặc tạo số lượng dân số). Bạn có thể lưu ý rằng các thuật toán di truyền rất chuyên sâu về tính toán và do đó loại bỏ các vấn đề quy mô lớn. Đương nhiên, khi một kiến trúc được tạo ra nó được đào tạo bằng cách sử dụng backpropagation hoặc bất kỳ kỹ thuật tối ưu hóa áp dụng nào khác, bao gồm cả GA.
Ví dụ: this video cho biết cách các thuật toán di truyền giúp chọn kiến trúc "tốt nhất" để chơi Mario và nó hoạt động rất tốt! Tuy nhiên, lưu ý rằng nếu GA chọn kiến trúc để chơi Mario rất tốt ở một cấp, kiến trúc đó sẽ không nhất thiết phải hoạt động tốt ở các cấp độ tiếp theo như được hiển thị trong another video.Theo tôi, điều này là bởi vì cả hai thuật toán di truyền và backpropagation có xu hướng tìm thấy một minima địa phương. Vì vậy, vẫn còn một chặng đường dài để đi ...
Nguồn
Sao chép lại thường tốt hơn nhiều so với thuật toán di truyền trong ngữ cảnh này – Untitled123
Cố gắng tìm một giới thiệu tốt về đề xuất lại :) – Untitled123
Bạn nghĩ chương trình trong video như thế nào ... Tính toán chức năng thể dục? – SSR