Chương 13: Reinforcement Learning
13.1 Introduction Nghĩa
13.2 The Learning Task Nghĩa
13.3 Q Learning Ân
13.3.1 The Q Function Ân
13.3.2 An Algorithm for Learning Q Ân
13.3.3 An Illustrative Example Ân
13.3.4 Convergence Ân
13.3.5 Experimentation Strategies Ân
13.3.6 Updating Sequence Ân
13.4 Nondeterministic Rewards and Action Dung
13.5 Temporal Difference Learning Dung
13.6 Generalizing from Examples Dung
13.7 Relationship to Dynamic Programming Dung
14.8 Summary and Further Reading Nghĩa
Exercises Nghĩa
Refrences Nghĩa
=================================================
Các phần phân chia đã quá rõ ràng
Ân, Dung chia phần nào làm hết phần đó
Phần anh Nghĩa làm không xong chia cho Ân và Dung làm cũng được
vói điều kiện mỗi tuần anh dẫn 2 đứa đi ăn một lần! he he :D
Thắc mắc liên hệ yahoo: huuan_huynh
Phần tiếng Anh có chỉnh sửa đôi chút để các bạn dễ dich hơn!
Học máy - Chương 13 - Reinforcement Learning (Học tập tăng cường?)
http://www.mediafire.com/?747v1u1asa276s5
No comments:
Post a Comment