首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 大数据理论与应用基础/新工科建设之路数据科学与大数据系列
内容
内容推荐
本书从初学者的角度详细介绍大数据的核心技术。全书共11章,包括绪论、Linux的基础操作、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、ZooKeeper分布式协调服务、YARN资源管理器、HBase分布式数据库、Hive数据仓储、PySpark数据处理与分析及综合案例。此外,本书还提供了相应的示例代码,以帮助读者进一步理解相关方案的实现过程。
本书可作为高等院校相关专业开设大数据有关课程的本科生、研究生的教材,也可作为从事大数据挖掘等工作的科研或工程技术人员的参考书。
目录
第1章 绪论
1.1 大数据的形成和发展
1.2 大数据的基本概念
1.2.1 什么是大数据
1.2.2 大数据的特征
1.3 大数据关键技术
1.3.1 大数据采集技术
1.3.2 大数据预处理技术
1.3.3 大数据存储与管理技术
1.3.4 大数据分析与挖掘技术
1.3.5 大数据展现与应用技术
1.4 大数据的行业应用
1.4.1 水利领域
1.4.2 生物医学领域
1.4.3 智慧城市领域
1.4.4 商业领域
1.4.5 信息安全领域
1.5 大数据领域的主要职位及其能力要求
1.5.1 首席数据官
1.5.2 数据科学家
1.5.3 大数据开发工程师
1.5.4 大数据运维工程师
1.6 本章小结
1.7 习题
第2章 Linux的基础操作
2.1 Linux概述
2.1.1 Linux系统的发行版本及特点
2.1.2 Linux与Windows系统对比
2.2 Linux命令
2.2.1 命令行技巧
2.2.2 Linux帮助命令
2.2.3 Linux文件类型及查看操作
2.2.4 文件与目录操作
2.2.5 文本编辑
2.2.6 文本过滤器与处理
2.2.7 用户与用户组管理
2.2.8 文件权限管理
2.2.9 归档与压缩
2.2.10 进程管理
2.3 本章小结
2.4 习题
第3章 Hadoop大数据处理架构
3.1 Hadoop简介
3.1.1 Hadoop的概念
3.1.2 Hadoop的发展史
3.1.3 Hadoop版本介绍
3.2 Hadoop的特性
3.3 Hadoop生态系统
3.3.1 Hadoop集群的架构
3.3.2 Hadoop生态系统的组件
3.4 部署Hadoop集群
3.4.1 Hadoop集群的部署方式
3.4.2 虚拟机的创建和配置
3.4.3 安装JDK
3.4.4 安装Hadoop
3.4.5 验证
3.5 本章小节
3.6 习题
第4章 HDFS分布式文件系统
4.1 HDFS简介
4.1.1 分布式文件系统的发展
4.1.2 HDFS的基本概念
4.1.3 HDFS的特点
4.2 HDFS的存储架构和工作原理
4.2.1 HDFS的存储架构
4.2.2 HDFS文件的读取原理
4.2.3 HDFS文件的写入原理
4.3 HDFS的Shell操作
4.4 HDFS的Java API介绍
4.4.1 HDFS Java API概述
4.4.2 使用Java API操作HDFS
4.5 本章小结
4.6 习题
第5章 MapReduce分布式计算框架
5.1 MapReduce简介
5.1.1 分布式并行编程
5.1.2 MapReduce模型简介
5.1.3 MapReduce的优/缺点
5.1.4 Map和Reduce函数
5.2 MapReduce的工作原理
5.2.1 工作原理概述
5.2.2 MapReduce的工作过程
5.2.3 Map任务的工作原理
5.2.4 Shuffle的工作原理
5.2.5 Reduce任务的工作原理
5.3 MapReduce编程组件
5.3.1 InputFormat组件
5.3.2 Mapper组件
5.3.3 Reducer组件
5.3.4 Partitioner组件
5.3.5 Combiner组件
5.3.6 OutputFormat组件
5.4 MapReduce案例
5.4.1 本地测试环境配置
5.4.2 WordCount
5.4.3 倒排索引
5.4.4 数据去重
5.4.5 Top
5.5 MapReduce实验
5.5.1 任务要求
5.5.2 环境准备
5.5.3 程序编写
5.5.4 本地测试
5.5.5 集群测试
5.6 本章小结
5.7 习题
第6章 ZooKeeper分布式协调服务
6.1 ZooKeeper概述
6.1.1 ZooKeeper的设计目标
6.1.2 ZooKeeper的特性
6.1.3 ZooKeeper集群角色
6.1.4 ZooKeeper实现
6.2 ZooKeeper数据模型
6.2.1 数据存储结构
6.2.2 节点类型
6.2.3 znode属性
6.2.4 znode数据访问
6.2.5 其他节点
6.2.6 ZooKeeper中的时间
6.3 watch机制
6.3.1 watch机制的定义
6.3.2 watch机制的语义
6.3.3 watch机制的实现
6.3.4 watch机制的特点
6.3.5 watch机制的通知状态和事件类型
6.3.6 ZooKeeper对watch的支持
6.4 ZooKeeper的选举机制
6.4.1 选举机制相关概念
6.4.2 选举机制类型
6.5 ZooKeeper会话
6.6 ZooKeeper使用ACL进行访问控制
6.6.1 ACL权限与内置方案
6.6.2 ZooKeeper C API
6.7 可插拔ZooKeeper身份验证
6.8 ZooKeeper绑定
6.8.1 Java绑定
6.8.2 C绑定
6.9 ZooKeeper部署及操作
6.9.1 ZooKeeper的下载与安装
6.9.2 配置修改
6.9.3 ZooKeeper操作
6.9.4 ZooKeeper集群部署
6.9.5 ZooKeeper的Java API操作
6.10 ZooKeeper典型应用
6.10.1 数据发布与订阅
6.10.2 负载均衡
6.10.3 命名服务
6.10.4 分布式锁
6.11 本章小结
6.12 习题
第7章 YARN资源管理器
7.1 YARN介绍
7.1.1 YARN的概念
7.1.2 YARN的应用场景
7.2 YARN的基本组成
7.2.1 ResourceManager
7.2.2 NodeManager
7.2.3
标签
缩略图
书名 大数据理论与应用基础/新工科建设之路数据科学与大数据系列
副书名
原作名
作者
译者
编者 吴慧欣//韩珂
绘者
出版社 电子工业出版社
商品编码(ISBN) 9787121463488
开本 16开
页数 388
版次 1
装订 平装
字数 640
出版时间 2023-09-01
首版时间 2023-09-01
印刷时间 2023-09-01
正文语种
读者对象 本科及以上
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 612
CIP核字 2023175534
中图分类号 TP274
丛书名
印张 25
印次 1
出版地 北京
260
185
18
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/17 2:57:35