首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 深度强化学习(基础研究与应用)
内容
内容推荐
深度强化学习结合深度学习与强化学习算法各自的优势解决复杂的决策任务。得益于Deep Mind AlphaGo和Open AI Five成功的案例,深度强化学习受到大量的关注,相关技术广泛应用于不同的领域。本书分为三大部分,覆盖深度强化学习的全部内容。第一部分介绍深度学习和强化学习的入门知识、一些非常基础的深度强化学习算法及其实现细节,包括第1~6章。第二部分是一些精选的深度强化学习研究题目,这些内容对准备开展深度强化学习研究的读者非常有用,包括第7~12章。第三部分提供了丰富的应用案例,包括Alpha Zero、让机器人学习跑步等,包括第13~17章。本书是为计算机科学专业背景、希望从零开始学习深度强化学习并开展研究课题和实践项目的学生准备的。本书也适合没有很强的机器学习背景、但是希望快速学习深度强化学习并将其应用到具体产品中的软件工程师阅读。
目录
基础部分
第1章 深度学习入门
1.1 简介
1.2 感知器
1.3 多层感知器
1.4 激活函数
1.5 损失函数
1.6 优化
1.6.1 梯度下降和误差的反向传播
1.6.2 随机梯度下降和自适应学习率
1.6.3 超参数筛选
1.7 正则化
1.7.1 过拟合
1.7.2 权重衰减
1.7.3 Dropout
1.7.4 批标准化
1.7.5 其他缓和过拟合的方法
1.8 卷积神经网络
1.9 循环神经网络
1.10 深度学习的实现样例
1.10.1 张量和梯度
1.10.2 定义模型
1.10.3 自定义层
1.10.4 多层感知器:MNIST数据集上的图像分类
1.10.5 卷积神经网络:CIFAR-10数据集上的图像分类
1.10.6 序列到序列模型:聊天机器人
第2章 强化学习入门
2.1 简介
2.2 在线预测和在线学习
2.2.1 简介
2.2.2 随机多臂赌博机
2.2.3 对抗多臂赌博机
2.2.4 上下文赌博机
2.3 马尔可夫过程
2.3.1 简介
2.3.2 马尔可夫奖励过程
2.3.3 马尔可夫决策过程
2.3.4 贝尔曼方程和最优性
2.3.5 其他重要概念
2.4 动态规划
2.4.1 策略迭代
2.4.2 价值迭代
2.4.3 其他DPs:异步DP、近似DP和实时DP
2.5 蒙特卡罗
标签
缩略图
书名 深度强化学习(基础研究与应用)
副书名
原作名
作者 董豪//丁子涵//仉尚航
译者
编者
绘者
出版社 电子工业出版社
商品编码(ISBN) 9787121411885
开本 16开
页数 489
版次 1
装订 平装
字数 745
出版时间 2021-07-01
首版时间 2021-07-01
印刷时间 2021-07-01
正文语种
读者对象 普通大众
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 950
CIP核字 2021093628
中图分类号 TP181
丛书名
印张 32.5
印次 1
出版地 北京
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/19 13:11:54