深度强化学习
TP181/3014-1
(印) 莫希特·塞瓦克著;尹大伟, 吴敏杰译
北京 国防工业出版社 2024
978-7-118-13179-6
165页 25cm
机器学习
5
中文图书
装备科技译著出版基金
本书从强化学习的基本模块开始,涵盖了流行的经典动态规划方法和经典强化学习方法,如价值迭代和策略迭代;同时也包括一些传统的强化学习算法,如时序差分学习、SARSA和Q学习。在此基础之上,介绍了适用于现代强化学习环境和智能体的深度学习和辅助工具。
1
1
无
(印) 莫希特·塞瓦克著 Mohit Seark. 深度强化学习[M]. 尹大伟, 吴敏杰译. 北京 国防工业出版社 2024.
点此复制
馆藏地址
条形码 | 目前状态 | 卷册号 | 馆藏地址 | 架位信息 |
---|---|---|---|---|
H412394 | 在馆 | 徐汇中文书库 | 书库3楼 2排3列1层 |