《深度强化学习(基础研究与应用)》董豪//丁子涵//仉尚航电子工业出版社PDF电子书网盘迅雷下载、免费在线阅读-兰台网

深度强化学习结合深度学习与强化学习算法各自的优势解决复杂的决策任务。得益于Deep Mind AlphaGo和Open AI Five成功的案例，深度强化学习受到大量的关注，相关技术广泛应用于不同的领域。本书分为三大部分，覆盖深度强化学习的全部内容。第一部分介绍深度学习和强化学习的入门知识、一些非常基础的深度强化学习算法及其实现细节，包括第1～6章。第二部分是一些精选的深度强化学习研究题目，这些内容对准备开展深度强化学习研究的读者非常有用，包括第7～12章。第三部分提供了丰富的应用案例，包括Alpha Zero、让机器人学习跑步等，包括第13～17章。本书是为计算机科学专业背景、希望从零开始学习深度强化学习并开展研究课题和实践项目的学生准备的。本书也适合没有很强的机器学习背景、但是希望快速学习深度强化学习并将其应用到具体产品中的软件工程师阅读。

基础部分
第1章深度学习入门
1.1 简介
1.2 感知器
1.3 多层感知器
1.4 激活函数
1.5 损失函数
1.6 优化
1.6.1 梯度下降和误差的反向传播
1.6.2 随机梯度下降和自适应学习率
1.6.3 超参数筛选
1.7 正则化
1.7.1 过拟合
1.7.2 权重衰减
1.7.3 Dropout
1.7.4 批标准化
1.7.5 其他缓和过拟合的方法
1.8 卷积神经网络
1.9 循环神经网络
1.10 深度学习的实现样例
1.10.1 张量和梯度
1.10.2 定义模型
1.10.3 自定义层
1.10.4 多层感知器：MNIST数据集上的图像分类
1.10.5 卷积神经网络：CIFAR-10数据集上的图像分类
1.10.6 序列到序列模型：聊天机器人
第2章强化学习入门
2.1 简介
2.2 在线预测和在线学习
2.2.1 简介
2.2.2 随机多臂赌博机
2.2.3 对抗多臂赌博机
2.2.4 上下文赌博机
2.3 马尔可夫过程
2.3.1 简介
2.3.2 马尔可夫奖励过程
2.3.3 马尔可夫决策过程
2.3.4 贝尔曼方程和最优性
2.3.5 其他重要概念
2.4 动态规划
2.4.1 策略迭代
2.4.2 价值迭代
2.4.3 其他DPs：异步DP、近似DP和实时DP
2.5 蒙特卡罗

图书	深度强化学习(基础研究与应用)
内容	内容推荐深度强化学习结合深度学习与强化学习算法各自的优势解决复杂的决策任务。得益于Deep Mind AlphaGo和Open AI Five成功的案例，深度强化学习受到大量的关注，相关技术广泛应用于不同的领域。本书分为三大部分，覆盖深度强化学习的全部内容。第一部分介绍深度学习和强化学习的入门知识、一些非常基础的深度强化学习算法及其实现细节，包括第1～6章。第二部分是一些精选的深度强化学习研究题目，这些内容对准备开展深度强化学习研究的读者非常有用，包括第7～12章。第三部分提供了丰富的应用案例，包括Alpha Zero、让机器人学习跑步等，包括第13～17章。本书是为计算机科学专业背景、希望从零开始学习深度强化学习并开展研究课题和实践项目的学生准备的。本书也适合没有很强的机器学习背景、但是希望快速学习深度强化学习并将其应用到具体产品中的软件工程师阅读。目录基础部分第1章深度学习入门 1.1 简介 1.2 感知器 1.3 多层感知器 1.4 激活函数 1.5 损失函数 1.6 优化 1.6.1 梯度下降和误差的反向传播 1.6.2 随机梯度下降和自适应学习率 1.6.3 超参数筛选 1.7 正则化 1.7.1 过拟合 1.7.2 权重衰减 1.7.3 Dropout 1.7.4 批标准化 1.7.5 其他缓和过拟合的方法 1.8 卷积神经网络 1.9 循环神经网络 1.10 深度学习的实现样例 1.10.1 张量和梯度 1.10.2 定义模型 1.10.3 自定义层 1.10.4 多层感知器：MNIST数据集上的图像分类 1.10.5 卷积神经网络：CIFAR-10数据集上的图像分类 1.10.6 序列到序列模型：聊天机器人第2章强化学习入门 2.1 简介 2.2 在线预测和在线学习 2.2.1 简介 2.2.2 随机多臂赌博机 2.2.3 对抗多臂赌博机 2.2.4 上下文赌博机 2.3 马尔可夫过程 2.3.1 简介 2.3.2 马尔可夫奖励过程 2.3.3 马尔可夫决策过程 2.3.4 贝尔曼方程和最优性 2.3.5 其他重要概念 2.4 动态规划 2.4.1 策略迭代 2.4.2 价值迭代 2.4.3 其他DPs：异步DP、近似DP和实时DP 2.5 蒙特卡罗
标签
缩略图
书名	深度强化学习(基础研究与应用)
副书名
原作名
作者	董豪//丁子涵//仉尚航
译者
编者
绘者
出版社	电子工业出版社
商品编码（ISBN）	9787121411885
开本	16开
页数	489
版次	1
装订	平装
字数	745
出版时间	2021-07-01
首版时间	2021-07-01
印刷时间	2021-07-01
正文语种	汉
读者对象	普通大众
适用范围
发行范围	公开发行
发行模式	实体书
首发网站
连载网址
图书大类
图书小类
重量	950
CIP核字	2021093628
中图分类号	TP181
丛书名
印张	32.5
印次	1
出版地	北京
长
宽
高
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示	适度休息有益身心健康，请勿长期沉迷于阅读小说。
随便看	海南国际旅游岛建设十年近岸海域生态环境质量变化趋势研究米芾蜀素帖集字古文浓情中药香囊末日辉煌磁共振伪影与假象全国青少年数独大赛题集一本小小的情绪管理书网络营销恐龙灭绝光电系统设计中医工程学导论(新版)(第9版)/杨华元/十二五规划勇探婆罗洲岭国形成史人民法庭实用手册 2019年版视唱练耳教程中外著名教育家画传系列:郭秉文画传论语彩绘注音版特种作业安全生产基本知识吃错会生病，吃对不吃药《丁丁游孙中山故居》（故事中山系列绘本）建筑装修装饰概论全国注册城乡规划师职业资格考试辅导教材第1分册城乡规划原理第12版交通建设工程施工企业安全生产管理实务流动人口健康与发展中国海洋经济 PT100温度阻值换算器软件 V1.0 中文绿色免费版逗溜 (交友必备) for Android V1.1.4 安卓版 2.1级以上 LittleT 事件提醒软件 v3.0 中文绿色免费版随身通打电话省钱软件 for android V1.0 安卓版智能网站管家 for IIS Win2003/Win2008 中文绿色免费版聊吧(聊天社交软件) for android v3.1 安卓版 Riot(精准优化图像大小)软件 v0.5.2 英文官方安装版 hg实用农历工具 v1.0 中文绿色免费版什么值得买(商品测评平台) v10.6.25 安卓版 MiTeC InfoBar (cpu内存使用率监控) v3.2.0.0 英文官方安装版 AI少女性感白木芽衣子MOD(性感御姐) 免费版火线精英跑酷王最新辅助(人物加速/空格升天/无敌) 跑酷专用 v1.0 免费特别版怪物猎人世界冰原两个五技能护石MOD(护石修改补丁) 免费版上古卷轴5天际服装工作室游戏工具(自定义身体和服装) 免费版漫漫长夜十项修改器(无限道具/无限体力/无限负重) v1.73 MrAntiFun版怪物猎人世界冰原无限升级防具等级MOD(防具等级最高LV99) 免费版 CF卢本伟透视自瞄多功能辅助 v200203 免费版光头强LOL skin特效换肤工具 v14.2 免费版三国志14瞬移狂暴阵MOD(新增天下无双战法AI无效限定版) v1.03 免费版浮岛物语六项修改器(无限生命/无限背包/饥饿不减) v2020.02.03 MrAntiFun版大明按察使荆棘花一个人战争绝地刀锋宫中残酷史：花的战争秘密非缘勿扰正义的重量小儿难养今夜天使降临