23

Đối với một dự án ai-class tôi cần phải thực hiện một thuật toán học tăng cường mà nhịp đập một trò chơi đơn giản của Tetris. Trò chơi được viết bằng Java và chúng tôi có mã nguồn. Tôi biết những điều cơ bản của lý thuyết học tập tăng cường nhưng đã tự hỏi nếu có ai trong cộng đồng SO đã có kinh nghiệm với loại điều này.Thực hiện tốt việc học tăng cường?

  1. Bài đọc được đề xuất của bạn là gì cho việc triển khai học tập tăng cường trong trò chơi Tetris?
  2. Có bất kỳ dự án nguồn mở tốt nào thực hiện những điều tương tự có đáng để kiểm tra không?

Chỉnh sửa: Tài nguyên chung càng tốt, nhưng các tài nguyên chung về chủ đề được hoan nghênh.

Theo dõi:

Nghĩ rằng nó sẽ được tốt đẹp nếu tôi đăng tải một followup.

Đây là giải pháp (mã và viết) tôi đã kết thúc với bất kỳ sinh viên tương lai nào :).

Paper/Code

+7

+1 để đặt câu hỏi về bài tập về nhà tốt. Đó là làm mới để xem ai đó yêu cầu để tìm hiểu một cái gì đó hơn là yêu cầu được đưa ra một cái gì đó. –

+3

Chắc chắn đã đồng ý; yêu cầu các tài nguyên học tập tốt là một câu hỏi hay, và cũng hữu ích cho những người khác trong tương lai – Sukasa

Trả lời

12

Hãy xem 2009 RL-competition. Một trong các miền có vấn đề là tetris game. Có một vấn đề Tetris năm trước. Dưới đây là số 52-page final report từ vòng chung kết năm thứ năm của địa điểm đó, nơi có rất nhiều chi tiết về cách tác nhân làm việc.

+0

nghe có vẻ thú vị nhưng các liên kết dường như đã chết .... – mikera

+0

@mikera Cố định một phần; trang web RL cạnh tranh năm 2009 đã biến mất nhưng Lưu trữ Internet đã lưu hầu hết nội dung. – andrewdotn

+0

Liên kết Dropbox đang đưa ra lỗi 404. –

3

Các Heaton Research ebook khá tốt tại giải thích khái niệm mạng nơ ron (với mã). Chương 4 dành riêng cho việc học máy và các phương pháp đào tạo khác nhau cho mạng của bạn. Có một thư viện có thể tải xuống và các ứng dụng mẫu để bạn xem.

2

TD-Gammon, gnubackgammon hoặc bất kỳ dự án tương tự nào khác là thành công lớn trong trò chơi.

Sutton & Sách của Barto "Học tập tăng cường: Giới thiệu" cũng có một số khác Case Studies.

1

Điều này không dành riêng cho việc học tăng cường, nhưng Stanford có một loạt bài giảng tuyệt vời trên machine learning on Youtube và iTunes.

Liên kết đến bài giảng đầu tiên mất khoảng 30 phút để đi sâu vào nội dung.

1

Burlap là thư viện Java gần đây cung cấp các triển khai của nhiều thuật toán tăng cường phổ biến cũng như một số môi trường và công cụ hữu ích.

Các vấn đề liên quan