首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 基于Apache Spark的流处理
内容
内容推荐
利用分析工具可以快速获取商业洞察,为此你需要了解如何对数据进行实时处理。通过这本实用指南,对于熟悉Apache Spark的读者来说,你们将了解如何将这个内存框架应用于流数据。你会发现Spark让你几乎可以像面对批处理作业一样来开发流处理作业。
本书介绍了Apache Spark的理论基础。这本综合指南通过两个部分比较了Spark支持的流处理API:早期Spark Streaming和后来的Structured Streaming。
作者简介
杰拉德·马斯是Lightbend的首席工程师,致力于将结构化流和其他可伸缩流处理技术无缝集成到Lightbend平台中。
目录

前言
第一部分 Apache Spark流处理的基本原理
第1章 流处理概述
什么是流处理
批处理与流处理
流处理中的时间概念
不确定性因素
流处理案例
可扩展的数据处理能力
扩展性与容错性
分布式流处理
Apache Spark概述
第一波浪潮:函数式API
第二波浪潮:SQL
统一的引擎
Spark组件
Spark Streaming
Structured Streaming
接下来?
第2章 流处理模型
数据源与接收器
不可变流
转换与聚合
窗口聚合
滚动窗口
滑动窗口
无状态处理与有状态处理
有状态的流
案例:Scala中的本地状态计算
无状态流,还是有状态流?
时间效应
带时间戳的事件计算
通过时间戳来定义时间概念
事件时间与处理时间
使用水位线计算
小结
第3章 流处理架构
数据平台的组件
体系模型
在流处理应用中使用批处理组件
流处理架构参考
Lambda架构
Kappa架构
……
第二部分 Structured Streaming
第三部分 Spark Streaming
第四部分 Spark Streaming高级技巧
第五部分 Apache Spark之外的世界
参考文献
作者介绍
封面介绍
标签
缩略图
书名 基于Apache Spark的流处理
副书名
原作名
作者 (美)杰拉德·马斯//弗朗索瓦·加里洛
译者 译者:陈志鹏
编者
绘者
出版社 中国电力出版社
商品编码(ISBN) 9787519852948
开本 16开
页数 422
版次 1
装订 平装
字数 581
出版时间 2021-03-01
首版时间 2021-03-01
印刷时间 2021-03-01
正文语种
读者对象
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 644
CIP核字 2021023075
中图分类号 TP274
丛书名
印张 27.75
印次 1
出版地 北京
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数 3000
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/12 15:59:22