图书 | Python机器学习 基于PyTorch和Scikit-Learn |
内容 | 编辑推荐 本书是一本在PyTorch环境下学习机器学习和深度学习的综合指南,可以作为初学者的入门教程,也可以作为读者开发机器学习项目时的参考书。 本书讲解清晰、示例生动,深入介绍了机器学习方法的基础知识,不仅提供了构建机器学习模型的说明,而且提供了构建机器学习模型和解决实际问题的基本准则。 本书添加了基于PyTorch的深度学习内容,介绍了新版Scikit-Learn。本书涵盖了多种用于文本和图像分类的机器学习与深度学习方法,介绍了用于生成新数据的生成对抗网络(GAN)和用于训练智能体的强化学习。最后,本书还介绍了深度学习的新动态,包括图神经网络和用于自然语言处理(NLP)的大型transformer。 无论是机器学习入门新手,还是计划跟踪机器学习进展的研发人员,都可以将本书作为使用Python进行机器学习的不二之选。 内容推荐 本书深入介绍了机器学习领域的基本概念和方法,除介绍了Python机器学习库和用机器学习库搭建神经网络模型的方法外,还介绍了机器学习算法的数学理论、工作原理、使用方法、实现细节以及如何避免机器学习算法实现过程中的常见问题。本书涵盖了多种用于文本和图像分类的机器学习与深度学习方法,以及用于生成新数据的生成对抗网络(GAN)和用于训练智能体的强化学习,还介绍了深度学习的新动态,包括图神经网络和用于自然语言处理(NLP)的大型transformer。本书讲解清晰,示例生动,理论和实践部分相对平衡,既可以作为机器学习领域初学者的入门教程,也可以作为读者开发机器学习项目时的参考书。 目录 译者序 序 前言 作者简介 审校者简介 第1章赋予计算机从数据中学习的能力1 1.1将数据转化为知识的智能系统1 1.2三种机器学习类型2 1.2.1用于预测未来的监督学习2 1.2.2解决交互问题的强化学习4 1.2.3发现数据中隐藏规律的无监督学习 5 1.3基本术语与符号6 1.3.1本书中使用的符号和约定6 1.3.2机器学习术语8 1.4构建机器学习系统的路线图8 1.4.1数据预处理——让数据可用8 1.4.2训练和选择预测模型9 1.4.3使用未见过的数据对模型进行评估10 1.5使用Python实现机器学习算法10 1.5.1从Python Package Index中安装Python和其他软件包10 1.5.2使用Anaconda Python软件包管理器11 1.5.3科学计算、数据科学和机器学习软件包12 1.6本章小结13 第2章训练简单的机器学习分类算法14 2.1人工神经元——机器学习早期历史一瞥14 2.1.1人工神经元的定义15 2.1.2感知机学习规则16 2.2使用Python实现感知机学习算法19 2.2.1面向对象的感知机API19 2.2.2使用鸢尾花数据集训练感知机22 2.3自适应线性神经元与算法收敛27 2.3.1使用梯度下降法最小化损失函数28 2.3.2在Python中实现Adaline30 2.3.3通过特征缩放改进梯度下降34 2.3.4大规模机器学习与随机梯度下降36 2.4本章小结41 第3章Scikit-Learn机器学习分类算法之旅42 3.1分类算法的选择42 3.2学习Scikit-Learn的第一步——训练感知机43 3.3用逻辑回归算法建模分类概率48 3.3.1逻辑回归与条件概率48 3.3.2用逻辑损失函数更新模型权重51 3.3.3从Adaline的代码实现到逻辑回归的代码实现53 3.3.4用Scikit-Learn训练逻辑回归模型56 3.3.5使用正则化避免模型过拟合59 3.4基于优选分类间隔的支持向量机62 3.4.1理解优选分类间隔62 3.4.2使用松弛变量解决非线性可分问题62 3.4.3Scikit-Learn中另外一种实现64 3.5使用核支持向量机求解非线性问题64 3.5.1处理线性不可分数据的核方法64 3.5.2使用核方法在高维空间中寻找分离超平面66 3.6决策树学习69 3.6.1优选化信息增益70 3.6.2构建决策树73 3.6.3多棵决策树组成随机森林76 3.7基于惰性学习策略的k近邻算法78 3.8本章小结81 第4章构建良好的训练数据集——数据预处理83 4.1处理缺失值83 4.1.1识别表格数据中的缺失值83 4.1.2删除含有缺失值的样本或特征85 4.1.3填补缺失值85 4.1.4Scikit-Learn的估计器86 4.2处理类别数据87 4.2.1用pandas实现类别数据编码88 4.2.2映射有序特征88 4.2.3类别标签编码89 4.2.4标称特征的独热编码90 4.3将数据集划分为训练数据集和测试数据集93 4.4使特征具有相同的尺度95 4.5选择有意义的特征97 4.5.1用L1和L2正则化对模型复杂度进行惩罚98 4.5.2L2正则化的几何解释98 4.5.3L1正则化与稀疏解99 4.5.4序贯特征选择算法102 4.6用随机森林评估特征重要性107 4.7本章小结109 第5章通过降维方法压缩数据110 5.1无监督降维的主成分分析方法110 5.1.1主成分分析的主要步骤110 5.1.2提取主成分的步骤112 5.1.3总方差和被解释的方差114 5.1.4特征变换115 5.1.5用Scikit-Learn实现主成分分析118 5.1.6评估特征的贡献120 5.2监督数据压缩的线性判别分析方法122 5.2.1主成分分析与线性判别分析122 5.2.2线性判别分析基本原理123 5.2.3计算散布矩阵124 5.2.4为新特征子空间选择线性判别式126 5.2.5将样本投影到新的特征空间128 5.2.6用Scikit-Learn实现线性判别分析128 5.3非线性降维和可视化130 5.3.1非线性降维的不足130 5.3.2使用t-SNE可视化数据131 5.4本章小结135 第6章模型评估和超参数调优的很好实践136 6.1使用pipeline方法简化工作流程136 6.1.1加载威斯康星乳腺癌数据集136 6.1.2在pipeline中集成转换器和估计器138 6.2使用k折交叉验证评估模型性能140 6.2.1holdout交叉验证140 6.2.2k折交叉验证140 6.3用学习曲线和验证曲线调试算法144 6.3.1使用学习曲线解决偏差和方差问题144 6.3.2使用验证曲线解决过拟合和欠拟合问题146 6.4通过网格搜索微调机器学习模型148 …… |
标签 | |
缩略图 | ![]() |
书名 | Python机器学习 基于PyTorch和Scikit-Learn |
副书名 | |
原作名 | |
作者 | (美)塞巴斯蒂安·拉施卡,(美)刘玉溪,(美)瓦希德·米尔贾利利 |
译者 | |
编者 | |
绘者 | |
出版社 | 机械工业出版社 |
商品编码(ISBN) | 9787111726814 |
开本 | 16开 |
页数 | 620 |
版次 | 1 |
装订 | |
字数 | 864000 |
出版时间 | 2023-06-01 |
首版时间 | |
印刷时间 | 2023-06-01 |
正文语种 | |
读者对象 | |
适用范围 | |
发行范围 | |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | 教育考试-考试-计算机类 |
图书小类 | |
重量 | |
CIP核字 | |
中图分类号 | TP311.561,TP181 |
丛书名 | |
印张 | |
印次 | 1 |
出版地 | |
长 | |
宽 | |
高 | |
整理 | |
媒质 | |
用纸 | |
是否注音 | |
影印版本 | |
出版商国别 | |
是否套装 | |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。