首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 Spark机器学习进阶实战/大数据技术丛书
内容
目录
前言
第一篇 基础篇
第1章 机器学习概述
1.1 机器学习概述
1.1.1 理解大数据
1.1.2 机器学习发展过程
1.1.3 大数据生态环境
1.2 机器学习算法
1.2.1 传统机器学习
1.2.2 深度学习
1.2.3 其他机器学习
1.3 机器学习分类
1.3.1 监督学习
1.3.2 无监督学习
1.3.3 半监督学习
1.3.4 强化学习
1.4 机器学习综合应用
1.4.1 异常检测
1.4.2 用户画像
1.4.3 广告点击率预估
1.4.4 企业征信大数据应用
1.4.5 智慧交通大数据应用
1.5 本章小结
第2章 数据分析流程和方法
2.1 数据分析概述
2.2 数据分析流程
2.2.1 业务调研
2.2.2 明确目标
2.2.3 数据准备
2.2.4 特征处理
2.2.5 模型训练与评估
2.2.6 输出结论
2.3 数据分析的基本方法
2.3.1 汇总统计
2.3.2 相关性分析
2.3.3 分层抽样
2.3.4 假设检验
2.4 简单的数据分析实践
2.4.1 环境准备
2.4.2 准备数据
2.4.3 数据分析
2.5 本章小结
第二篇 算法篇
第3章 构建分类模型
第4章 构建聚类模型
第5章 构建回归模型
第6章 构建关联规则模型
第7章 协同过滤
第8章 数据降维
第三篇 综合应用篇
第9章 异常检测
第10章 用户画像
第11章 广告点击率预估
第12章 企业征信大数据应用
第13章 智慧交通大数据应用
内容推荐
科大讯飞大数据专家团队撰写,不囿于Spark机器学习库,突出算法的工程化思维与实践。从基础引出算法,从算法实践到场景应用,层层推进,分享笔者的一些想法和见解,铺展开更为深入、全面的思路。
6大机器学习模型构建
分类:刻画事物特征的类标识,有效预测未知数据的归类情况。
聚类:根据相似程度生成对象集合,同集合相似,不同集合相异。
回归:找出数据规律和趋势,预测数据未来变化。
关联规则:挖掘关联关系,辅助商业决策。
协同过滤:刻画用户相似兴趣,实现偏好预测。
降维:有效地消除无关和冗余特征,提升模型精度。
5大典型应用场景
异常检测:有效解决入侵检测、欺诈检测、社交假新闻等问题。
用户画像:高度精炼用户的特征标识,为产品与决策提供数据支持和事实依据。
点击率预估:预估点击概率,计算点击收益,选出收益最高的策略。
企业征信:提供信用信息服务,洞察企业信用风险。
智慧交通:实现交通数据的价值,提供解决城市交通问题的思路。
同时,马海平、于俊、吕昕、向海著的《Spark机器学习进阶实战/大数据技术丛书》从《道德经》和《庄子》精选名言,并结合大数据机器学习相关内容,对名言加以讲解,引导大家以老庄的思想来认识大数据的内涵。
标签
缩略图
书名 Spark机器学习进阶实战/大数据技术丛书
副书名
原作名
作者 马海平//于俊//吕昕//向海
译者
编者
绘者
出版社 机械工业出版社
商品编码(ISBN) 9787111608103
开本 16开
页数 210
版次 1
装订 平装
字数
出版时间 2018-09-01
首版时间 2018-09-01
印刷时间 2018-09-01
正文语种
读者对象 普通大众
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 390
CIP核字 2018201129
中图分类号 TP274
丛书名
印张 14
印次 1
出版地 北京
240
186
11
整理
媒质
用纸
是否注音
影印版本
出版商国别 CN
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/7 23:13:38