《大数据理论与应用基础/新工科建设之路数据科学与大数据系列》电子工业出版社PDF电子书网盘迅雷下载、免费在线阅读-兰台网

第1章绪论
1.1 大数据的形成和发展
1.2 大数据的基本概念
1.2.1 什么是大数据
1.2.2 大数据的特征
1.3 大数据关键技术
1.3.1 大数据采集技术
1.3.2 大数据预处理技术
1.3.3 大数据存储与管理技术
1.3.4 大数据分析与挖掘技术
1.3.5 大数据展现与应用技术
1.4 大数据的行业应用
1.4.1 水利领域
1.4.2 生物医学领域
1.4.3 智慧城市领域
1.4.4 商业领域
1.4.5 信息安全领域
1.5 大数据领域的主要职位及其能力要求
1.5.1 首席数据官
1.5.2 数据科学家
1.5.3 大数据开发工程师
1.5.4 大数据运维工程师
1.6 本章小结
1.7 习题
第2章 Linux的基础操作
2.1 Linux概述
2.1.1 Linux系统的发行版本及特点
2.1.2 Linux与Windows系统对比
2.2 Linux命令
2.2.1 命令行技巧
2.2.2 Linux帮助命令
2.2.3 Linux文件类型及查看操作
2.2.4 文件与目录操作
2.2.5 文本编辑
2.2.6 文本过滤器与处理
2.2.7 用户与用户组管理
2.2.8 文件权限管理
2.2.9 归档与压缩
2.2.10 进程管理
2.3 本章小结
2.4 习题
第3章 Hadoop大数据处理架构
3.1 Hadoop简介
3.1.1 Hadoop的概念
3.1.2 Hadoop的发展史
3.1.3 Hadoop版本介绍
3.2 Hadoop的特性
3.3 Hadoop生态系统
3.3.1 Hadoop集群的架构
3.3.2 Hadoop生态系统的组件
3.4 部署Hadoop集群
3.4.1 Hadoop集群的部署方式
3.4.2 虚拟机的创建和配置
3.4.3 安装JDK
3.4.4 安装Hadoop
3.4.5 验证
3.5 本章小节
3.6 习题
第4章 HDFS分布式文件系统
4.1 HDFS简介
4.1.1 分布式文件系统的发展
4.1.2 HDFS的基本概念
4.1.3 HDFS的特点
4.2 HDFS的存储架构和工作原理
4.2.1 HDFS的存储架构
4.2.2 HDFS文件的读取原理
4.2.3 HDFS文件的写入原理
4.3 HDFS的Shell操作
4.4 HDFS的Java API介绍
4.4.1 HDFS Java API概述
4.4.2 使用Java API操作HDFS
4.5 本章小结
4.6 习题
第5章 MapReduce分布式计算框架
5.1 MapReduce简介
5.1.1 分布式并行编程
5.1.2 MapReduce模型简介
5.1.3 MapReduce的优/缺点
5.1.4 Map和Reduce函数
5.2 MapReduce的工作原理
5.2.1 工作原理概述
5.2.2 MapReduce的工作过程
5.2.3 Map任务的工作原理
5.2.4 Shuffle的工作原理
5.2.5 Reduce任务的工作原理
5.3 MapReduce编程组件
5.3.1 InputFormat组件
5.3.2 Mapper组件
5.3.3 Reducer组件
5.3.4 Partitioner组件
5.3.5 Combiner组件
5.3.6 OutputFormat组件
5.4 MapReduce案例
5.4.1 本地测试环境配置
5.4.2 WordCount
5.4.3 倒排索引
5.4.4 数据去重
5.4.5 Top
5.5 MapReduce实验
5.5.1 任务要求
5.5.2 环境准备
5.5.3 程序编写
5.5.4 本地测试
5.5.5 集群测试
5.6 本章小结
5.7 习题
第6章 ZooKeeper分布式协调服务
6.1 ZooKeeper概述
6.1.1 ZooKeeper的设计目标
6.1.2 ZooKeeper的特性
6.1.3 ZooKeeper集群角色
6.1.4 ZooKeeper实现
6.2 ZooKeeper数据模型
6.2.1 数据存储结构
6.2.2 节点类型
6.2.3 znode属性
6.2.4 znode数据访问
6.2.5 其他节点
6.2.6 ZooKeeper中的时间
6.3 watch机制
6.3.1 watch机制的定义
6.3.2 watch机制的语义
6.3.3 watch机制的实现
6.3.4 watch机制的特点
6.3.5 watch机制的通知状态和事件类型
6.3.6 ZooKeeper对watch的支持
6.4 ZooKeeper的选举机制
6.4.1 选举机制相关概念
6.4.2 选举机制类型
6.5 ZooKeeper会话
6.6 ZooKeeper使用ACL进行访问控制
6.6.1 ACL权限与内置方案
6.6.2 ZooKeeper C API
6.7 可插拔ZooKeeper身份验证
6.8 ZooKeeper绑定
6.8.1 Java绑定
6.8.2 C绑定
6.9 ZooKeeper部署及操作
6.9.1 ZooKeeper的下载与安装
6.9.2 配置修改
6.9.3 ZooKeeper操作
6.9.4 ZooKeeper集群部署
6.9.5 ZooKeeper的Java API操作
6.10 ZooKeeper典型应用
6.10.1 数据发布与订阅
6.10.2 负载均衡
6.10.3 命名服务
6.10.4 分布式锁
6.11 本章小结
6.12 习题
第7章 YARN资源管理器
7.1 YARN介绍
7.1.1 YARN的概念
7.1.2 YARN的应用场景
7.2 YARN的基本组成
7.2.1 ResourceManager
7.2.2 NodeManager
7.2.3

图书	大数据理论与应用基础/新工科建设之路数据科学与大数据系列
内容	内容推荐本书从初学者的角度详细介绍大数据的核心技术。全书共11章，包括绪论、Linux的基础操作、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、ZooKeeper分布式协调服务、YARN资源管理器、HBase分布式数据库、Hive数据仓储、PySpark数据处理与分析及综合案例。此外，本书还提供了相应的示例代码，以帮助读者进一步理解相关方案的实现过程。本书可作为高等院校相关专业开设大数据有关课程的本科生、研究生的教材，也可作为从事大数据挖掘等工作的科研或工程技术人员的参考书。目录第1章绪论 1.1 大数据的形成和发展 1.2 大数据的基本概念 1.2.1 什么是大数据 1.2.2 大数据的特征 1.3 大数据关键技术 1.3.1 大数据采集技术 1.3.2 大数据预处理技术 1.3.3 大数据存储与管理技术 1.3.4 大数据分析与挖掘技术 1.3.5 大数据展现与应用技术 1.4 大数据的行业应用 1.4.1 水利领域 1.4.2 生物医学领域 1.4.3 智慧城市领域 1.4.4 商业领域 1.4.5 信息安全领域 1.5 大数据领域的主要职位及其能力要求 1.5.1 首席数据官 1.5.2 数据科学家 1.5.3 大数据开发工程师 1.5.4 大数据运维工程师 1.6 本章小结 1.7 习题第2章 Linux的基础操作 2.1 Linux概述 2.1.1 Linux系统的发行版本及特点 2.1.2 Linux与Windows系统对比 2.2 Linux命令 2.2.1 命令行技巧 2.2.2 Linux帮助命令 2.2.3 Linux文件类型及查看操作 2.2.4 文件与目录操作 2.2.5 文本编辑 2.2.6 文本过滤器与处理 2.2.7 用户与用户组管理 2.2.8 文件权限管理 2.2.9 归档与压缩 2.2.10 进程管理 2.3 本章小结 2.4 习题第3章 Hadoop大数据处理架构 3.1 Hadoop简介 3.1.1 Hadoop的概念 3.1.2 Hadoop的发展史 3.1.3 Hadoop版本介绍 3.2 Hadoop的特性 3.3 Hadoop生态系统 3.3.1 Hadoop集群的架构 3.3.2 Hadoop生态系统的组件 3.4 部署Hadoop集群 3.4.1 Hadoop集群的部署方式 3.4.2 虚拟机的创建和配置 3.4.3 安装JDK 3.4.4 安装Hadoop 3.4.5 验证 3.5 本章小节 3.6 习题第4章 HDFS分布式文件系统 4.1 HDFS简介 4.1.1 分布式文件系统的发展 4.1.2 HDFS的基本概念 4.1.3 HDFS的特点 4.2 HDFS的存储架构和工作原理 4.2.1 HDFS的存储架构 4.2.2 HDFS文件的读取原理 4.2.3 HDFS文件的写入原理 4.3 HDFS的Shell操作 4.4 HDFS的Java API介绍 4.4.1 HDFS Java API概述 4.4.2 使用Java API操作HDFS 4.5 本章小结 4.6 习题第5章 MapReduce分布式计算框架 5.1 MapReduce简介 5.1.1 分布式并行编程 5.1.2 MapReduce模型简介 5.1.3 MapReduce的优/缺点 5.1.4 Map和Reduce函数 5.2 MapReduce的工作原理 5.2.1 工作原理概述 5.2.2 MapReduce的工作过程 5.2.3 Map任务的工作原理 5.2.4 Shuffle的工作原理 5.2.5 Reduce任务的工作原理 5.3 MapReduce编程组件 5.3.1 InputFormat组件 5.3.2 Mapper组件 5.3.3 Reducer组件 5.3.4 Partitioner组件 5.3.5 Combiner组件 5.3.6 OutputFormat组件 5.4 MapReduce案例 5.4.1 本地测试环境配置 5.4.2 WordCount 5.4.3 倒排索引 5.4.4 数据去重 5.4.5 Top 5.5 MapReduce实验 5.5.1 任务要求 5.5.2 环境准备 5.5.3 程序编写 5.5.4 本地测试 5.5.5 集群测试 5.6 本章小结 5.7 习题第6章 ZooKeeper分布式协调服务 6.1 ZooKeeper概述 6.1.1 ZooKeeper的设计目标 6.1.2 ZooKeeper的特性 6.1.3 ZooKeeper集群角色 6.1.4 ZooKeeper实现 6.2 ZooKeeper数据模型 6.2.1 数据存储结构 6.2.2 节点类型 6.2.3 znode属性 6.2.4 znode数据访问 6.2.5 其他节点 6.2.6 ZooKeeper中的时间 6.3 watch机制 6.3.1 watch机制的定义 6.3.2 watch机制的语义 6.3.3 watch机制的实现 6.3.4 watch机制的特点 6.3.5 watch机制的通知状态和事件类型 6.3.6 ZooKeeper对watch的支持 6.4 ZooKeeper的选举机制 6.4.1 选举机制相关概念 6.4.2 选举机制类型 6.5 ZooKeeper会话 6.6 ZooKeeper使用ACL进行访问控制 6.6.1 ACL权限与内置方案 6.6.2 ZooKeeper C API 6.7 可插拔ZooKeeper身份验证 6.8 ZooKeeper绑定 6.8.1 Java绑定 6.8.2 C绑定 6.9 ZooKeeper部署及操作 6.9.1 ZooKeeper的下载与安装 6.9.2 配置修改 6.9.3 ZooKeeper操作 6.9.4 ZooKeeper集群部署 6.9.5 ZooKeeper的Java API操作 6.10 ZooKeeper典型应用 6.10.1 数据发布与订阅 6.10.2 负载均衡 6.10.3 命名服务 6.10.4 分布式锁 6.11 本章小结 6.12 习题第7章 YARN资源管理器 7.1 YARN介绍 7.1.1 YARN的概念 7.1.2 YARN的应用场景 7.2 YARN的基本组成 7.2.1 ResourceManager 7.2.2 NodeManager 7.2.3
标签
缩略图
书名	大数据理论与应用基础/新工科建设之路数据科学与大数据系列
副书名
原作名
作者
译者
编者	吴慧欣//韩珂
绘者
出版社	电子工业出版社
商品编码（ISBN）	9787121463488
开本	16开
页数	388
版次	1
装订	平装
字数	640
出版时间	2023-09-01
首版时间	2023-09-01
印刷时间	2023-09-01
正文语种	汉
读者对象	本科及以上
适用范围
发行范围	公开发行
发行模式	实体书
首发网站
连载网址
图书大类
图书小类
重量	612
CIP核字	2023175534
中图分类号	TP274
丛书名
印张	25
印次	1
出版地	北京
长	260
宽	185
高	18
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示	适度休息有益身心健康，请勿长期沉迷于阅读小说。
随便看	中国哲学史大纲/博库丛刊海关密档(民国海关事件掠影)/看历史系列丛书溯洄从美--从批评理论到文学翻译/外国文学研究丛书何家英和他的学生(名家课堂) 世界童话故事铸造手册(1铸铁第3版)(精) 面向对象技术UML教程/软件工程系列教材大耳朵爷爷历险记(1) 新编长笛演奏实用教程琵琶(1级-5级中国音乐学院社会艺术水平考级全国通用教材) 琵琶(6级-8级中国音乐学院社会艺术水平考级全国通用教材) 电子商务实务(高等学校电子商务专业规划教材) C语言程序设计<第2版>学习辅导(高等院校计算机应用技术规划教材)/应用型教材系列秦汉至五代官私藏书研究/传统社会与文化研究丛书天津漕运研究(1368-1840)/天津通史专题研究丛书明清天津盐业研究(1368-1840)/天津通史专题研究丛书葡萄整形修剪图解综合布线技术与工程(普通高等教育十一五国家级规划教材) 扇形山水/轻轻松松学国画肉鸡养殖技术问答/专家释疑解难农业技术丛书模具钳工技术与实训(高职高专机电类专业规划教材) 建筑力学与结构学习指导(21世纪建筑装饰系列规划教材) 概率论与数理统计(第2版普通高等教育基础课规划教材) 数控机床及其应用/普通中等专业教育机电类规划教材贝叶斯统计(第2版全国统计教材编审委员会十二五规划教材) Task Information Manager Master of My Domain BD Author Rapid MIDI To MP3 Converter Odin Blu Ray DVD to iPhone Ripper Sync iOS Port Matrix MSN Dial-up Internet Access Software Rapid Network Configurator Big Bad Bird Let?us?Paint?with?Danny 狂欢三宝-米老鼠一家历险记连连看蛋糕免费版美女逗你玩双截龙二?-?复仇美国疯狂房地产史努比射箭疯狂卡丁车 Krazy Kart Racing 怪兽卡片幽灵鸡你好检察官正青春上游幸福还会来敲门虫图腾不能说的秘密都是一家人青春抛物线我怕来不及妄想少女MOMO