下面是我在数院强化学习讨论班 seminar 用的讲稿,Neuromatch 2023 我也使用这个讲稿用于解释 n-step grid world 的例子。

如果你的浏览器没有直接显示 PDF,可以点这里打开 PDF