《Python机器学习案例教程(原书第2版)/大数据丛书》(英)刘宇熙机械工业出版社PDF电子书网盘迅雷下载、免费在线阅读-兰台网

译者序
前言
第1部分机器学习的基础
第1章机器学习和Python入门
1.1 超高水平的机器学习技术概述
1.1.1 机器学习任务的分类
1.1.2 机器学习算法的发展简史
1.2 机器学习的核心——数据泛化
1.2.1 过拟合、欠拟合和偏差-方差权衡
1.2.2 利用交叉验证避免过拟合
1.2.3 利用正则化避免过拟合
1.2.4 通过特征选择和降维避免过拟合
1.3 预处理、探索和特征工程
1.3.1 缺失值
1.3.2 标签编码
1.3.3 独热编码
1.3.4 缩放
1.3.5 多项式特征
1.3.6 幂变换
1.3.7 分箱
1.4 组合模型
1.4.1 投票法和平均法
1.4.2 装袋法
1.4.3 提升方法
1.4.4 堆叠法
1.5 安装软件和设置
1.5.1 设置Python和环境
1.5.2 安装各种软件包
本章小结
习题
第2部分 Python机器学习实例
第2章使用文本分析技术研究20组新闻数据集
2.1 计算机如何理解语言——NLP
2.2 浏览NLP库并学习NLP基础知识
2.2.1 语料库
2.2.2 标记
2.2.3 词性
2.2.4 命名实体识别
2.2.5 词干提取和词形还原
2.2.6 语义和主题建模
2.3 获取新闻组数据
2.4 研究新闻组数据
2.5 考虑文本数据的特性
2.5.1 计算每个单词表征的出现次数
2.5.2 文本预处理
2.5.3 丢弃停止词
2.5.4 词干提取和词形还原法
2.6 使用t-SNE可视化新闻组数据
2.6.1 什么是降维
2.6.2 用于降维的t-SNE
本章小结
习题
第3章使用聚类和主题建模算法挖掘20组新闻数据集
3.1 没有指导的学习——无监督学习
3.2 使用k均值聚类算法对新闻数据集进行聚类
3.2.1 k均值聚类算法是如何聚类的
3.2.2 从头实现k均值聚类算法
3.2.3 用机器学习实现后均值聚类算法
3.2.4 k值的选择
3.2.5 使用k均值聚类新闻组数据
3.3 在新闻组中发现基础主题
3.4 使用NMF进行主题建模
3.5 使用LDA进行主题建模
本章小结
习题
第4章使用朴素贝叶斯检测垃圾邮件
4.1 从分类开始
4.1.1 分类算法的类型
4.1.2 文本分类的应用
4.2 探索朴素贝叶斯
4.2.1 通过案例来学习贝叶斯定理
4.2.2 朴素贝叶斯的结构
4.2.3 运用scratch库实现朴素贝叶斯分类器
4.2.4 运用scikit-learn库实现朴素贝叶斯分类器
4.3 分类性能评估
4.4 模型调优和交叉验证
本章小结
习题
第5章使用支持向量机对新闻组主题进行分类
5.1 用支持向量机寻找分离边界
5.1.1 通过不同的示例了解支持向量机如何工作
5.1.2 实现支持向量机
5.1.3 支持向量机的核心
5.1.4 在线性核和RBF核之间进行选择
5.2 使用支持向量机对新闻组主题进行分类
5.3 更多示例——心脏造影的胎儿状态分类
5.4 另一个示例——使用TensorFlow完成基于支持向量机的乳腺癌分类
本章小结
习题
第6章使用基于树的算法预测在线广告点击率
6.1 广告点击率预测概述
6.2 两种类型数据：数值型和分类型
6.3 从根到叶探索决策树
6.3.1 构建决策树
6.3.2 衡量分裂的标准
6.4 从头实现决策树
6.5 用决策树预测广告点击率
6.6 集成决策树——随机森林
6.6.1 使用TensorFlow实现随机森林
本章小结
习题
第7章使用逻辑回归预测在线广告点击率
7.1 将分类特征转换为数字特征——独热编码和顺序编码
7.2 用逻辑回归对数据进行分类
7.2.1 逻辑函数入门
7.2.2 从逻辑函数到逻辑回归
7.3 训练逻辑回归模型
7.3.1 利用梯度下降训练逻辑回归模型
7.3.2 利用梯度下降的逻辑回归模型预测在线广告点击率
7.3.3 利用随机梯度下降训练逻辑回归模型
7.3.4 利用正则化训练逻辑回归模型
7.4 通过在线学习训练大型数据集
7.5 处理多元分类
7.6 使用TensorFlow实现逻辑回归
7.7 使用随机森林进行特征选择
本章小结
习题
第8章将预测扩展到TB级点击日志
8.1 学习Apache Spark的基本知识
8.1.1 了解Spark
8.1.2 安装Spark
8.1.3 启动和部署Spark程序
8.2 在PySpark中编程
8.3 使用Spark学习大量点击日志
8.3.1 加载点击日志
8.3.2 拆分和缓存数据
8.3.3 对分类特征进行独热编码
8.3.4 训练和测试逻辑回归模型
8.4 使用Spark对分类变量进行特征工程
8.4.1 散列分类特征
8.4.2 组合多个变量——

图书	Python机器学习案例教程(原书第2版)/大数据丛书
内容	内容推荐本书包括3部分：第1部分介绍机器学习的基本概念，它们是机器学习的预备知识；第2部分系统介绍几种成熟的机器学习算法和技术；第3部分介绍贯穿整个机器学习工作流程的21个最佳案例，并且讨论具有前瞻性的方法和想法，它们被公认为是机器学习未来的研究重点。本书中的代码均在Python 3中测试通过。本书适合高等院校相关专业的大学生、研究生或教师阅读学习，以及不具有机器学习或统计背景但是想要快速补充机器学习算法知识，以便在实际产品或平台中应用的软件工程师。目录译者序前言第1部分机器学习的基础第1章机器学习和Python入门 1.1 超高水平的机器学习技术概述 1.1.1 机器学习任务的分类 1.1.2 机器学习算法的发展简史 1.2 机器学习的核心——数据泛化 1.2.1 过拟合、欠拟合和偏差-方差权衡 1.2.2 利用交叉验证避免过拟合 1.2.3 利用正则化避免过拟合 1.2.4 通过特征选择和降维避免过拟合 1.3 预处理、探索和特征工程 1.3.1 缺失值 1.3.2 标签编码 1.3.3 独热编码 1.3.4 缩放 1.3.5 多项式特征 1.3.6 幂变换 1.3.7 分箱 1.4 组合模型 1.4.1 投票法和平均法 1.4.2 装袋法 1.4.3 提升方法 1.4.4 堆叠法 1.5 安装软件和设置 1.5.1 设置Python和环境 1.5.2 安装各种软件包本章小结习题第2部分 Python机器学习实例第2章使用文本分析技术研究20组新闻数据集 2.1 计算机如何理解语言——NLP 2.2 浏览NLP库并学习NLP基础知识 2.2.1 语料库 2.2.2 标记 2.2.3 词性 2.2.4 命名实体识别 2.2.5 词干提取和词形还原 2.2.6 语义和主题建模 2.3 获取新闻组数据 2.4 研究新闻组数据 2.5 考虑文本数据的特性 2.5.1 计算每个单词表征的出现次数 2.5.2 文本预处理 2.5.3 丢弃停止词 2.5.4 词干提取和词形还原法 2.6 使用t-SNE可视化新闻组数据 2.6.1 什么是降维 2.6.2 用于降维的t-SNE 本章小结习题第3章使用聚类和主题建模算法挖掘20组新闻数据集 3.1 没有指导的学习——无监督学习 3.2 使用k均值聚类算法对新闻数据集进行聚类 3.2.1 k均值聚类算法是如何聚类的 3.2.2 从头实现k均值聚类算法 3.2.3 用机器学习实现后均值聚类算法 3.2.4 k值的选择 3.2.5 使用k均值聚类新闻组数据 3.3 在新闻组中发现基础主题 3.4 使用NMF进行主题建模 3.5 使用LDA进行主题建模本章小结习题第4章使用朴素贝叶斯检测垃圾邮件 4.1 从分类开始 4.1.1 分类算法的类型 4.1.2 文本分类的应用 4.2 探索朴素贝叶斯 4.2.1 通过案例来学习贝叶斯定理 4.2.2 朴素贝叶斯的结构 4.2.3 运用scratch库实现朴素贝叶斯分类器 4.2.4 运用scikit-learn库实现朴素贝叶斯分类器 4.3 分类性能评估 4.4 模型调优和交叉验证本章小结习题第5章使用支持向量机对新闻组主题进行分类 5.1 用支持向量机寻找分离边界 5.1.1 通过不同的示例了解支持向量机如何工作 5.1.2 实现支持向量机 5.1.3 支持向量机的核心 5.1.4 在线性核和RBF核之间进行选择 5.2 使用支持向量机对新闻组主题进行分类 5.3 更多示例——心脏造影的胎儿状态分类 5.4 另一个示例——使用TensorFlow完成基于支持向量机的乳腺癌分类本章小结习题第6章使用基于树的算法预测在线广告点击率 6.1 广告点击率预测概述 6.2 两种类型数据：数值型和分类型 6.3 从根到叶探索决策树 6.3.1 构建决策树 6.3.2 衡量分裂的标准 6.4 从头实现决策树 6.5 用决策树预测广告点击率 6.6 集成决策树——随机森林 6.6.1 使用TensorFlow实现随机森林本章小结习题第7章使用逻辑回归预测在线广告点击率 7.1 将分类特征转换为数字特征——独热编码和顺序编码 7.2 用逻辑回归对数据进行分类 7.2.1 逻辑函数入门 7.2.2 从逻辑函数到逻辑回归 7.3 训练逻辑回归模型 7.3.1 利用梯度下降训练逻辑回归模型 7.3.2 利用梯度下降的逻辑回归模型预测在线广告点击率 7.3.3 利用随机梯度下降训练逻辑回归模型 7.3.4 利用正则化训练逻辑回归模型 7.4 通过在线学习训练大型数据集 7.5 处理多元分类 7.6 使用TensorFlow实现逻辑回归 7.7 使用随机森林进行特征选择本章小结习题第8章将预测扩展到TB级点击日志 8.1 学习Apache Spark的基本知识 8.1.1 了解Spark 8.1.2 安装Spark 8.1.3 启动和部署Spark程序 8.2 在PySpark中编程 8.3 使用Spark学习大量点击日志 8.3.1 加载点击日志 8.3.2 拆分和缓存数据 8.3.3 对分类特征进行独热编码 8.3.4 训练和测试逻辑回归模型 8.4 使用Spark对分类变量进行特征工程 8.4.1 散列分类特征 8.4.2 组合多个变量——
标签
缩略图
书名	Python机器学习案例教程(原书第2版)/大数据丛书
副书名
原作名
作者	(英)刘宇熙
译者	译者:强彦//赵涓涓
编者
绘者
出版社	机械工业出版社
商品编码（ISBN）	9787111677109
开本	16开
页数	233
版次	1
装订	平装
字数	381
出版时间	2021-05-01
首版时间	2021-05-01
印刷时间	2021-05-01
正文语种	汉
读者对象	本科及以上
适用范围
发行范围	公开发行
发行模式	实体书
首发网站
连载网址
图书大类
图书小类
重量	430
CIP核字	2021041707
中图分类号	TP311.561
丛书名
印张	15.5
印次	1
出版地	北京
长	259
宽	185
高	11
整理
媒质
用纸
是否注音
影印版本
出版商国别	CN
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示	适度休息有益身心健康，请勿长期沉迷于阅读小说。
随便看	无知的美德智造工匠培养的制作习得教法革新老子其人其书及其学派(精)/大家小书短视频电商美工(视觉营销+视频拍摄+剪辑调色+爆款制作) 种一朵月亮花/当代作家作品精选城市基层社会治理体系的回天样本--建构与实践(精)/政治与哲学书系/光明学术文库 Scratch编程入门(无人车上下) 自行自省自悟三苏年谱(共4册)(精) 世界是概率的--伊藤清的数学思想与方法独联体国家的税收政策及税务风险研究(精)/博士生导师学术文库为伊消得人憔悴(柳永词传) 整村调查报告(2021人口流动与现代化转型实录)/百县千村万户调查系列深入理解高并发编程(JDK核心技术)/冰河技术丛书 HSK标准会话教程(4下) 原来物理这么奇妙(揭开物理不可思议的一面)/原来世界这么有趣微流控芯片技术全清小说(康熙卷10) 用心做校长屋面工程施工操作规程(YS\T5410-2022备案号J3052-2022)/中华人民共和国行业标准新时代高校文化安全教育研究(精)/历史与文化书系/光明学术文库救援装备一起快乐读书吧 2年级上(全5册) 稀土铈基环境催化材料(精) 往来山海(精) k米点歌 PC电脑版 v2.4.0 官方最新版 Pubmed Explorer浏览器 v2.0 免费绿色版麻辣点评手机客户端 for android v1.3.5 安卓版魔力文件批量改名工具 1.0 免费绿色版 Tipix手机客户端 for android v1.8.5 安卓版 Avid Media Composer(电影视频编辑工具) v7.0 官方中文版魔力优酷VIP会员电影破解播放器 1.0 免费绿色版 Beautiful Soup(HTML/XML解析器) v4.3.2 官方安装版 3D作业集成工具箱(The Pixel Farm PFDepth) v12.4.2 官方最新版快准牌电脑发软件 v7.0 免费安装版 Billy the Frog Lite 球霸王 Glow Movie 急速砖块！（演示版）使命防御王子的球 BUTTONZ Same Game Gravity FREE HackTris DubCopter 曙光平凡的岁月钻石边缘的珍珠第三医院外滩警事戏里戏外第二季七年不痒理想的儿子半熟恋人莲花