图书 | 循序渐进Spark大数据应用开发 |
内容 | 内容推荐 \t本书结合作者一线开发实践,循序渐进地介绍了新版Apache Spark 3.x的开发技术。全书共10章,第1章和第2章主要介绍Spark的基本概念、安装,并演示如何编写最简单的Spark程序。第3章深入探讨了Spark的核心组件RDD。第4章讲解了Spark集群管理,帮助读者理解任务提交与执行的基本原理。第5章介绍了Spark SQL,这是处理结构化数据的基础工具。第6章展示了Spark Web UI,通过界面化的方式了解Spark集群运行状况。第7章和第8章分别介绍了Spark流式数据处理框架Spark Streaming和Structured Streaming。第9章和第10章则分别介绍了业界流行的机器学习和图计算处理框架MLlib和GraphX。书中各章节还提供了丰富的实战案例和上机练习题,以便读者在学习的同时进行实际操作,迅速提升动手能力。 \t本书技术先进,案例丰富,适合对Spark大数据应用感兴趣的学生、大数据开发人员及架构师使用,也可作为培训机构和高校大数据课程的教学用书。 目录 第1章 Spark概述 1 1.1 Spark简介 1 1.1.1 诞生与初始阶段 1 1.1.2 开源与社区建设 2 1.1.3 成为很好项目 2 1.1.4 版本更新 3 1.2 Spark组成 4 1.2.1 Spark Core 5 1.2.2 集群管理器 5 1.2.3 Spark UI 5 1.2.4 Spark SQL 6 1.2.5 Spark Streaming 6 1.2.6 Structured Streaming 6 1.2.7 MLlib 6 1.2.8 GraphX 7 1.2.9 其他 7 1.3 Spark数据类型 7 1.3.1 RDD 7 1.3.2 DataFrame 8 1.3.3 Dataset 8 1.3.4 数值类型 8 1.3.5 字符串类型 8 1.3.6 日期和时间类型 9 1.3.7 复杂类型 9 1.4 Spark的使用场景 9 1.4.1 批处理 9 1.4.2 实时流处理 9 1.4.3 分布式文件系统 10 1.4.4 机器学习 10 1.4.5 图计算 10 1.5 Spark与Hadoop的联系与区别 11 1.5.1 Hadoop概述 11 …… |
标签 | |
缩略图 | ![]() |
书名 | 循序渐进Spark大数据应用开发 |
副书名 | |
原作名 | |
作者 | 柳伟卫 |
译者 | |
编者 | |
绘者 | |
出版社 | 清华大学出版社 |
商品编码(ISBN) | 9787302675204 |
开本 | 16开 |
页数 | 292 |
版次 | 1 |
装订 | |
字数 | 493000 |
出版时间 | 2024-11-01 |
首版时间 | |
印刷时间 | 2024-11-01 |
正文语种 | |
读者对象 | |
适用范围 | |
发行范围 | |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | 教育考试-考试-计算机类 |
图书小类 | |
重量 | |
CIP核字 | |
中图分类号 | TP274 |
丛书名 | |
印张 | |
印次 | 1 |
出版地 | |
长 | |
宽 | |
高 | |
整理 | |
媒质 | |
用纸 | |
是否注音 | |
影印版本 | |
出版商国别 | |
是否套装 | |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。