首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 强化学习 微课版
内容
编辑推荐
本书是强化学习领域的入门书籍。本书结合大量清晰易懂的实际用用案例,能够帮助读者更好地理解强化学习各个算法的实现原理,降低了强化学习入学门槛。书中架构安排合理,语言表达准确,推理证明齐全。
内容推荐
本书构建了一个完整的强化学习入门路径,深入浅出地介绍了强化学习算法的基本原理和实现方法。本书首先回顾了相关预备知识,包括数学基础和机器学习基础,然后先介绍强化学习的基本概念,给出强化学习的数学框架(马尔可夫决策过程),随后介绍强化学习的求解算法,包括表格求解法(动态规划法、蒙特卡洛法和时序差分法),以及近似求解法(值函数近似法、策略梯度法和深度强化学习)。本书最后一部分为实践与前沿,实践部分基于一个相同的例子实现了强化学习领域的主流基础算法,前沿部分介绍了强化学习领域的近期新研究进展。本书配有相当数量的习题供练习,配套代码基于Python实现,源代码均已开源,可开放获取。本书可作为理工科本科生、研究生的“强化学习”课程的教材,也可作为相关从业者掌握强化学习的入门参考书。
目录
I 概述
第1章 导论
1.1 强化学习简介
1.1.1 两个主要特征
1.1.2 与机器学习的关系
1.2 强化学习发展史
1.2.1 试错学习
1.2.2 很优控制
1.2.3 时序差分学习
1.2.4 深度强化学习
1.3 本书的主要内容
1.4 本章小结
II 预备知识
第2章 概率统计与随机过程
2.1 概率论
2.1.1 集合
2.1.2 概率
2.1.3 随机试验与随机事件
2.1.4 条件概率与独立事件
2.1.5 随机变量
2.1.6 期望与方差
2.1.7 概率分布
2.2 统计学基础
2.2.1 大数定律
2.2.2 中心极限定理
2.3 随机过程
2.3.1 基本概念
2.3.2 分布函数
2.3.3 基本类型
2.3.4 马尔可夫过程
2.3.5 马尔可夫链的状态分类
2.3.6 平稳分布
2.4 本章小结
第3章 机器学习
3.1 基本概念
3.2 线性回归
3.3 逻辑回归
3.3.1 逻辑回归模型
3.3.2 逻辑回归指标
3.3.3 逻辑回归算法
3.4 随机梯度下降
3.4.1 随机梯度下降法
3.4.2 基于SGD实现逻辑回归
3.5 本章小结
第4章 神经网络
4.1 神经元
4.2 感知机
4.2.1 感知机模型
4.2.2 感知机指标
4.2.3 感知机算法
4.3 神经网络
4.3.1 神经网络模型
4.3.2 神经网络指标
4.3.3 神经网络算法
4.3.4 梯度消失现象
4.4 本章小结
第5章 深度学习
……
III 强化学习基础
IV 表格求解法
V 近似求解法
VI 实践与前沿
VII 附录
标签
缩略图
书名 强化学习 微课版
副书名
原作名
作者 袁莎,白朔天,唐杰
译者
编者
绘者
出版社 清华大学出版社
商品编码(ISBN) 9787302587941
开本 16开
页数 300
版次 1
装订
字数 451000
出版时间 2021-10-01
首版时间
印刷时间 2021-10-01
正文语种
读者对象
适用范围
发行范围
发行模式 实体书
首发网站
连载网址
图书大类 教育考试-大中专教材-大学教材
图书小类
重量
CIP核字
中图分类号 TP181
丛书名
印张
印次 1
出版地
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/12 5:41:45