首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 高性能分布式计算系统开发与实现(基于Hadoop\Scalding和Spark)/数据科学与工程技术丛书
内容
作者简介
K.G.斯里尼瓦沙,于2007年获得班加罗尔大学计算机科学与工程博士学位。现就职于班加罗尔的M.S.拉迈阿理工学院计算机科学与工程系,任教授兼主任。他在靠前会议和期刊上共发表过一百多篇研究论文,曾作为访问学者出访过许多大学。他是UGC、DRDO和DST资助的多个项目的首席研究员,其研究领域包括数据挖掘、机器学习、高性能计算和云计算。他是IEEE和ACM的不错成员。
阿尼尔·库马尔·穆帕拉,既是一位研究者也是一个作家。具有计算机科学和工程学学位。他是很多行业的软件开发者和顾问。他是活跃的研究者,并在靠前会议和期刊上发表诸多文章。他研究的方向包括使用Hadoop、Scalding和Spark进行应用开发。
目录
译者序
前言
作者简介
第一部分 高性能分布式计算编程基础
第1章 引言
1.1 分布式系统
1.2 分布式系统类型
1.2.1 分布式嵌入式系统
1.2.2 分布式信息系统
1.2.3 分布式计算系统
1.3 分布式计算架构
1.4 分布式文件系统
1.4.1 分布式文件系统需求
1.4.2 分布式文件系统架构
1.5 分布式系统面临的挑战
1.6 分布式系统的发展趋势
1.7 高性能分布式计算系统示例
参考文献
第2章 Hadoop入门
2.1 Hadoop简介
2.2 Hadoop生态系统
2.3 Hadoop分布式文件系统
2.3.1 HDFS的特性
2.3.2 名称节点和数据节点
2.3.3 文件系统
2.3.4 数据复制
2.3.5 通信
2.3.6 数据组织
2.4 MapReduce准备工作
2.5 安装前的准备
2.6 单节点集群的安装
2.7 多节点集群的安装
2.8 Hadoop编程
2.9 Hadoop流
参考文献
第3章 Spark入门
3.1 Spark简介
3.2 Spark内部结构
3.3 Spark安装
3.3.1 安装前的准备
3.3.2 开始使用
3.3.3 示例:Scala应用
3.3.4 Python下Spark的使用
3.3.5 示例:Python应用
3.4 Spark部署
3.4.1 应用提交
3.4.2 单机模式
参考文献
第4章 Scalding和Spark的内部编程
4.1 Scalding简介
4.1.1 安装
4.1.2 编程指南
4.2 Spark编程指南
参考文献
第二部分 使用Hadoop、Scalding和Spark的案例研究
第5章 案例研究Ⅰ:使用Scalding和Spark进行数据聚类
5.1 简介
5.2 聚类
5.2.1 聚类方法
5.2.2 聚类处理
5.2.3 K均值算法
5.2.4 简单的K均值示例
5.3 实现
问题
参考文献
第6章 案例研究Ⅱ:使用Scalding和Spark进行数据分类
6.1 分类
6.2 概率论
6.2.1 随机变量
6.2.2 分布
6.2.3 均值和方差
6.3 朴素贝叶斯
6.3.1 概率模型
6.3.2 参数估计和事件模型
6.3.3 示例
6.4 朴素贝叶斯分类器的实现
6.4.1 Scalding实现
6.4.2 结果
问题
参考文献
第7章 案例研究Ⅲ:使用Scalding和Spark进行回归分析
7.1 回归分析的步骤
7.2 实现细节
7.2.1 线性回归:代数方法
7.2.2 代数方法的Scalding实现
7.2.3 代数方法的Spark实现
7.2.4 线性回归:梯度下降法
7.2.5 梯度下降法的Scalding实现
7.2.6 梯度下降法的Spark实现
问题
参考文献
第8章 案例研究Ⅳ:使用Scalding和Spark实现推荐系统
8.1 推荐系统
8.1.1 目标
8.1.2 推荐系统的数据源
8.1.3 推荐系统中使用的技术
8.2 实现细节
8.2.1 Spark实现
8.2.2 Scalding实现
问题
参考文献
索引
内容推荐
K.G.斯里尼瓦沙、阿尼尔·库马尔·穆帕拉著的《高性能分布式计算系统开发与实现(基于Hadoop\\Scalding和Spark)/数据科学与工程技术丛书》介绍了如何使用开源工具和技术开发与实现大规模分布式处理系统,涵盖构建高性能分布式计算系统的方法和最佳实践。第一部分(第1~4章)介绍了高性能分布式计算编程的基础知识,包括分布式系统、Hadoop入门、Spark入门、Scalding入门等;第二部分(第5~8章)给出了使用Hadoop、Spark、Scalding的案例研究,涉及数据聚类、数据分类、回归分析、推荐系统等。
本书适合作为高等院校计算机、大数据相关专业的教材,也适合作为软件工程师、应用开发人员、科研人员的参考书。
标签
缩略图
书名 高性能分布式计算系统开发与实现(基于Hadoop\Scalding和Spark)/数据科学与工程技术丛书
副书名
原作名
作者 作者:(印度)K.G.斯里尼瓦沙//阿尼尔·库马尔·穆帕拉
译者 译者:高辉//李东升//王宏志
编者
绘者
出版社 机械工业出版社
商品编码(ISBN) 9787111601531
开本 16开
页数 234
版次 1
装订 平装
字数
出版时间 2018-07-01
首版时间 2018-07-01
印刷时间 2018-07-01
正文语种
读者对象 本科及以上
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 434
CIP核字 2018138279
中图分类号 TP274
丛书名
印张 15.25
印次 1
出版地 北京
260
184
13
整理
媒质
用纸
是否注音
影印版本
出版商国别 CN
是否套装
著作权合同登记号 图字01-2017-2015
版权提供者 由Springer授权出版
定价 69.00
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/13 3:24:12