Thực hiện tốt việc học tăng cường?

Đối với một dự án ai-class tôi cần phải thực hiện một thuật toán học tăng cường mà nhịp đập một trò chơi đơn giản của Tetris. Trò chơi được viết bằng Java và chúng tôi có mã nguồn. Tôi biết những điều cơ bản của lý thuyết học tập tăng cường nhưng đã tự hỏi nếu có ai trong cộng đồng SO đã có kinh nghiệm với loại điều này.Thực hiện tốt việc học tăng cường?

Bài đọc được đề xuất của bạn là gì cho việc triển khai học tập tăng cường trong trò chơi Tetris?
Có bất kỳ dự án nguồn mở tốt nào thực hiện những điều tương tự có đáng để kiểm tra không?

Chỉnh sửa: Tài nguyên chung càng tốt, nhưng các tài nguyên chung về chủ đề được hoan nghênh.

Theo dõi:

Nghĩ rằng nó sẽ được tốt đẹp nếu tôi đăng tải một followup.

Đây là giải pháp (mã và viết) tôi đã kết thúc với bất kỳ sinh viên tương lai nào :).

Paper/Code

Nguồn

2009-04-11 bdd

+1 để đặt câu hỏi về bài tập về nhà tốt. Đó là làm mới để xem ai đó yêu cầu để tìm hiểu một cái gì đó hơn là yêu cầu được đưa ra một cái gì đó. –

Chắc chắn đã đồng ý; yêu cầu các tài nguyên học tập tốt là một câu hỏi hay, và cũng hữu ích cho những người khác trong tương lai – Sukasa

Hãy xem 2009 RL-competition. Một trong các miền có vấn đề là tetris game. Có một vấn đề Tetris năm trước. Dưới đây là số 52-page final report từ vòng chung kết năm thứ năm của địa điểm đó, nơi có rất nhiều chi tiết về cách tác nhân làm việc.

Nguồn

2009-04-13 02:32:22 andrewdotn

nghe có vẻ thú vị nhưng các liên kết dường như đã chết .... – mikera

@mikera Cố định một phần; trang web RL cạnh tranh năm 2009 đã biến mất nhưng Lưu trữ Internet đã lưu hầu hết nội dung. – andrewdotn

Liên kết Dropbox đang đưa ra lỗi 404. –

Các Heaton Research ebook khá tốt tại giải thích khái niệm mạng nơ ron (với mã). Chương 4 dành riêng cho việc học máy và các phương pháp đào tạo khác nhau cho mạng của bạn. Có một thư viện có thể tải xuống và các ứng dụng mẫu để bạn xem.

Nguồn

2009-04-11 17:05:00 Codebrain

Đây là một cuốn sách hay về đề tài này:

Machine Learning and Data Mining: Introduction to Principles and Algorithms
bởi Igor Kononenko, Matjaz Kukar (tháng Sáu, 2007)

Ngoài ra hãy xem tại các dự án mã nguồn mở:

Nguồn

2009-04-11 17:08:52

TD-Gammon, gnubackgammon hoặc bất kỳ dự án tương tự nào khác là thành công lớn trong trò chơi.

Sutton & Sách của Barto "Học tập tăng cường: Giới thiệu" cũng có một số khác Case Studies.

Nguồn

2009-08-25 06:21:51