首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 基于PYSPARK的高级数据分析
内容
内容推荐
时至今日产生的数据量达到了一个惊人的地步,而且还在不断增长。Apache Sparki已经成为分析大数据的实际工具,并且也是数据科学工具箱的关键部分。本书针对Spark近期新版本进行了更新,将Spak、统计方法和真实数据集结合在一起,教你如何运用PySpark、Spark Python API和Spark编程中的其他很好实践来解决分析问题。
数据科学家Akash Tandon、Sandy Ryza、Uri Laserson、Sean Owen和Josh Wills介绍了Spark:生态系统,然后深入研究将常用技术(包括分类、聚类、协同过滤和异常检测)应用于以下领域:基因组学、安全工作和金融。此更新版本还涵盖图像处理和Spark NLP库。
如果你对机器学习和统计学有基本的了解,并且能够使用Python进行编程,那么本书将帮助你开始进行大规模的数据分析。
目录
前言
第1章 大数据分析
1.1 使用大数据
1.2 Apache Spark PySpark
1.2.1 组件
1.2.2 PySpark
1.2.3 生态系统
1.3 Spark 3.0
1.4 PySpark处理数据科学问题
1.5 本章小结
第2章 PySpark数据分析简介
2.1 Spark架构
2.2 安装PySpark
2.3 设置我们的数据
2.4 使用DataFrame API分析数据
2.5 DataFrames的快速汇总统计
……
标签
缩略图
书名 基于PYSPARK的高级数据分析
副书名
原作名
作者 Akash Tandon ... [等] 著
译者
编者
绘者
出版社 中国电力出版社
商品编码(ISBN) 9787519891862
开本 16开
页数 243
版次 1
装订
字数 334000
出版时间 2024-09-01
首版时间
印刷时间
正文语种
读者对象
适用范围
发行范围
发行模式 实体书
首发网站
连载网址
图书大类 教育考试-考试-计算机类
图书小类
重量
CIP核字
中图分类号 TP274
丛书名
印张
印次 1
出版地
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/7 23:59:31