《Hive实战/图灵程序设计丛书》(美)斯科特·肖//(南非)安德烈亚斯·弗朗索瓦·弗穆尔恩//(印)安库尔·古普塔//(美)戴维·杰鲁姆加德人民邮电出版社PDF电子书网盘迅雷下载、免费在线阅读-兰台网

第1章为Hive打好基础：Hadoop
1.1 一只小象出生了
1.2 Hadoop的结构
1.3 数据冗余
1.3.1 传统的高可用性
1.3.2 Hadoop的高可用性
1.4 MapReduce处理
1.4.1 超越MapReduce
1.4.2 YARN和现代数据架构
1.4.3 Hadoop和开源社区
1.4.4 我们身在何处
第2章 Hive简介
2.1 Hadoop发行版
2.2 集群架构
2.3 Hive的安装
2.4 探寻你的方式
2.5 HiveCLI
第3章 Hive架构
3.1 Hive组件
3.2 HCatalog
3.3 HiveServer2
3.4 客户端工具
3.5 执行引擎：Tez
第4章 Hive表DDL
4.1 schema-on-read
4.2 Hive数据模型
4.2.1 模式/数据库
4.2.2 为什么使用多个模式/数据库
4.2.3 创建数据库
4.2.4 更改数据库
4.2.5 删除数据库
4.2.6 列出数据库
4.3 Hive中的数据类型
4.3.1 基本数据类型
4.3.2 选择数据类型
4.3.3 复杂数据类型
4.4 表
4.4.1 创建表
4.4.2 列出表
4.4.3 内部表/外部表
4.4.4 内部表/受控表
4.4.5 内部表/外部表示例
4.4.6 表的属性
4.4.7 生成已有表的CREATETABLE命令
4.4.8 分区和分桶
4.4.9 分区注意事项
4.4.10 对日期列进行高效分区
4.4.11 分桶的注意事项
4.4.12 更改表
4.4.13 ORC文件格式
4.4.14 更改表分区
4.4.15 修改列
4.4.16 删除表/分区
4.4.17 保护表/分区
4.4.18 其他CREATETABLE命令选项
第5章数据操作语言
5.1 将数据装载到表中
5.1.1 使用存储在HDFS中的文件装载数据
5.1.2 使用查询装载数据
5.1.3 将查询到的数据写入文件系统
5.1.4 直接向表插入值
5.1.5 直接更新表中数据
5.1.6 在表中直接删除数据
5.1.7 创建结构相同的表
5.2 连接
5.2.1 使用等值连接来整合表
5.2.2 使用外连接
5.2.3 使用左半连接
5.2.4 用单次MapReduce实现连接
5.2.5 最后使用最大的表
5.2.6 事务处理
5.2.7 ACID是什么，以及为什么要用到它
5.2.8 Hive配置
第6章将数据装载到Hive
6.1 装载数据之前的设计注意事项
6.2 将数据装载到HDFS
6.2.1 Ambari文件视图
6.2.2 Hadoop命令行
6.2.3 HDFS的NFSGateway
6.2.4 Sqoop
6.2.5 ApacheNiFi
6.3 用Hive访问数据
6.3.1 外部表
6.3.2 LOADDATA语句
6.4 在Hive中装载增量变更数据
6.5 Hive流处理
6.6 小结
第7章查询半结构化数据
7.1 点击流数据
7.1.1 摄取数据
7.1.2 创建模式
7.1.3 装载数据
7.1.4 查询数据
7.2 摄取JSON数据
7.2.1 使用UDF查询JSON
7.2.2 使用SerDe访问JSON
第8章 Hive分析
8.1 构建分析模型
8.1.1 使用太阳模型获取需求
8.1.2 将太阳模型转换为星型模式
8.1.3 构建数据仓库
8.2 评估分析模型.
8.2.1 评估太阳模型
8.2.2 评估聚合结果
8.2.3 评估数据集市
8.3 掌握数据仓库管理
8.3.1 必备条件
8.3.2 检索数据库
8.3.3 评估数据库
8.3.4 过程数据库
8.3.5 转换数据库
8.3.6 你掌握了什么
8.3.7 组织数据库
8.3.8 报表数据库
8.3.9 示例报表
8.4 高级分析
8.5 接下来学什么
第9章 Hive性能调优
9.1 Hive性能检查表
9.2 执行引擎
9.2.1 MapReduce
9.2.2 Tez
9.3 存储格式
9.3.1 ORC格式
9.3.2 Parquet格式
9.4 矢量化查询执行
9.5 查询执行计划
9.5.1 基于代价的优化
9.5.2 执行计划
9.5.3 性能检查表小结
第10章 Hive的安全性
10.1 数据安全性的几个方面
10.1.1 身份认证
10.1.2 授权
10.1.3 管理
10.1.4 审计
10.1.5 数据保护
10.2 Hadoop的安全性
10.3 Hive的安全性
10.3.1 默认授权模式
10.3.2 基于存储的授权模式
10.3.3 基于SQL标准的授权模式
10.3.4 管理通过SQL进行的访问
10.4 使用Ranger进行Hive授权
10.4.1 访问Ranger用户界面
10.4.2 创建Ranger策略
10.4.3 使用Ranger审计
第11章 Hive的未来
11.1 LLAP
11.2 Hive-on-Spark
11.3 Hive：ACID和MERGE
11.4 可调隔离等级
11.5 ROLAP/基于立方体的分析
11.6 HiveServer2的发展
11.7 面向不同工作负载的多个HiveServer2实例
附录A 建立大数据团队
附录B Hive函数

图书	Hive实战/图灵程序设计丛书
内容	目录第1章为Hive打好基础：Hadoop 1.1 一只小象出生了 1.2 Hadoop的结构 1.3 数据冗余 1.3.1 传统的高可用性 1.3.2 Hadoop的高可用性 1.4 MapReduce处理 1.4.1 超越MapReduce 1.4.2 YARN和现代数据架构 1.4.3 Hadoop和开源社区 1.4.4 我们身在何处第2章 Hive简介 2.1 Hadoop发行版 2.2 集群架构 2.3 Hive的安装 2.4 探寻你的方式 2.5 HiveCLI 第3章 Hive架构 3.1 Hive组件 3.2 HCatalog 3.3 HiveServer2 3.4 客户端工具 3.5 执行引擎：Tez 第4章 Hive表DDL 4.1 schema-on-read 4.2 Hive数据模型 4.2.1 模式/数据库 4.2.2 为什么使用多个模式/数据库 4.2.3 创建数据库 4.2.4 更改数据库 4.2.5 删除数据库 4.2.6 列出数据库 4.3 Hive中的数据类型 4.3.1 基本数据类型 4.3.2 选择数据类型 4.3.3 复杂数据类型 4.4 表 4.4.1 创建表 4.4.2 列出表 4.4.3 内部表/外部表 4.4.4 内部表/受控表 4.4.5 内部表/外部表示例 4.4.6 表的属性 4.4.7 生成已有表的CREATETABLE命令 4.4.8 分区和分桶 4.4.9 分区注意事项 4.4.10 对日期列进行高效分区 4.4.11 分桶的注意事项 4.4.12 更改表 4.4.13 ORC文件格式 4.4.14 更改表分区 4.4.15 修改列 4.4.16 删除表/分区 4.4.17 保护表/分区 4.4.18 其他CREATETABLE命令选项第5章数据操作语言 5.1 将数据装载到表中 5.1.1 使用存储在HDFS中的文件装载数据 5.1.2 使用查询装载数据 5.1.3 将查询到的数据写入文件系统 5.1.4 直接向表插入值 5.1.5 直接更新表中数据 5.1.6 在表中直接删除数据 5.1.7 创建结构相同的表 5.2 连接 5.2.1 使用等值连接来整合表 5.2.2 使用外连接 5.2.3 使用左半连接 5.2.4 用单次MapReduce实现连接 5.2.5 最后使用最大的表 5.2.6 事务处理 5.2.7 ACID是什么，以及为什么要用到它 5.2.8 Hive配置第6章将数据装载到Hive 6.1 装载数据之前的设计注意事项 6.2 将数据装载到HDFS 6.2.1 Ambari文件视图 6.2.2 Hadoop命令行 6.2.3 HDFS的NFSGateway 6.2.4 Sqoop 6.2.5 ApacheNiFi 6.3 用Hive访问数据 6.3.1 外部表 6.3.2 LOADDATA语句 6.4 在Hive中装载增量变更数据 6.5 Hive流处理 6.6 小结第7章查询半结构化数据 7.1 点击流数据 7.1.1 摄取数据 7.1.2 创建模式 7.1.3 装载数据 7.1.4 查询数据 7.2 摄取JSON数据 7.2.1 使用UDF查询JSON 7.2.2 使用SerDe访问JSON 第8章 Hive分析 8.1 构建分析模型 8.1.1 使用太阳模型获取需求 8.1.2 将太阳模型转换为星型模式 8.1.3 构建数据仓库 8.2 评估分析模型. 8.2.1 评估太阳模型 8.2.2 评估聚合结果 8.2.3 评估数据集市 8.3 掌握数据仓库管理 8.3.1 必备条件 8.3.2 检索数据库 8.3.3 评估数据库 8.3.4 过程数据库 8.3.5 转换数据库 8.3.6 你掌握了什么 8.3.7 组织数据库 8.3.8 报表数据库 8.3.9 示例报表 8.4 高级分析 8.5 接下来学什么第9章 Hive性能调优 9.1 Hive性能检查表 9.2 执行引擎 9.2.1 MapReduce 9.2.2 Tez 9.3 存储格式 9.3.1 ORC格式 9.3.2 Parquet格式 9.4 矢量化查询执行 9.5 查询执行计划 9.5.1 基于代价的优化 9.5.2 执行计划 9.5.3 性能检查表小结第10章 Hive的安全性 10.1 数据安全性的几个方面 10.1.1 身份认证 10.1.2 授权 10.1.3 管理 10.1.4 审计 10.1.5 数据保护 10.2 Hadoop的安全性 10.3 Hive的安全性 10.3.1 默认授权模式 10.3.2 基于存储的授权模式 10.3.3 基于SQL标准的授权模式 10.3.4 管理通过SQL进行的访问 10.4 使用Ranger进行Hive授权 10.4.1 访问Ranger用户界面 10.4.2 创建Ranger策略 10.4.3 使用Ranger审计第11章 Hive的未来 11.1 LLAP 11.2 Hive-on-Spark 11.3 Hive：ACID和MERGE 11.4 可调隔离等级 11.5 ROLAP/基于立方体的分析 11.6 HiveServer2的发展 11.7 面向不同工作负载的多个HiveServer2实例附录A 建立大数据团队附录B Hive函数内容推荐 Hive“出身名门”，是最初由Facebook公司开发的数据仓库工具。它简单且容易上手，是深入学习Hadoop技术的一个很好的切入点。斯科特·肖，安德烈亚斯·弗朗索瓦·弗穆尔恩，安库尔·古普塔，戴维·杰鲁姆加德著的《Hive实战》由数据库专家和大数据专家共同撰写，具体内容包括：Hive的安装和配置，其核心组件和架构，Hive数据操作语言，如何加载、查询和分析数据，Hive的性能调优以及安全性，等等。本书旨在为读者打牢基础，从而踏上专业的大数据处理之旅。本书面向数据科学家以及对大数据技术感兴趣的读者。
标签
缩略图
书名	Hive实战/图灵程序设计丛书
副书名
原作名
作者	(美)斯科特·肖//(南非)安德烈亚斯·弗朗索瓦·弗穆尔恩//(印)安库尔·古普塔//(美)戴维·杰鲁姆加德
译者	译者:唐富年
编者
绘者
出版社	人民邮电出版社
商品编码（ISBN）	9787115493910
开本	16开
页数	238
版次	1
装订	平装
字数	366
出版时间	2018-11-01
首版时间	2018-11-01
印刷时间	2018-11-01
正文语种	汉
读者对象	普通大众
适用范围
发行范围	公开发行
发行模式	实体书
首发网站
连载网址
图书大类
图书小类
重量	426
CIP核字	2018216737
中图分类号	TP311.13
丛书名
印张	15.5
印次	1
出版地	北京
长	233
宽	186
高	11
整理
媒质
用纸
是否注音
影印版本
出版商国别	CN
是否套装
著作权合同登记号	图字01-2018-5948号
版权提供者	由Apress L.P.授权
定价
印数	3000
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示	适度休息有益身心健康，请勿长期沉迷于阅读小说。
随便看	昆虫学研究方法与技术导论亚洲文明与亚洲发展中外联合研究报告(No.7) 平凡中的非凡——日常生活美学地基与基础工程施工寻觅瑞士/文化欧洲丛书/精典人文旅游系列让中学生受益一生的智慧故事全集两天的世界(全2册) 我环保,从节约一滴水做起汉藏对照现代写作学教程游憩生态学(原书第2版) 尖子生题库语文 7年级上册画坛巨匠贾科梅蒂素描阳光同学课时优化作业数学 4年级(上) RJ 高等数学(基础版)(第2版) 冷庐医话小学语文阅读一课一得 2年级上册迈向新时代的智慧社会:中国智慧城市发展战略研究麻雀兰迪的歌唱生活/西顿动物小说全集乌鸦队长银斑儿/西顿动物小说全集非常时期深度强化学习基于Python的理论及实践新出简牍与秦汉赋役制度研究小学成语周周练 4年级土木工程制图(第2版) 好爸爸胜过好老师之玩在幼儿 Topaz DeJPEG for MAC Free Ico Converter All Free PDF to JPG Converter Quick Pallet Maker Bytescout Watermarking Multi View Inpaint for mac Multi View Inpaint AL Pictures Slideshow Studio 3D Glossy Icons Free Gif Viewer 乞丐战士午餐物语-小女生最爱毁灭公爵 Doom 僵尸狂奔之死亡城愚人娱己飞翔的鸡蛋简单版毒品战争之房屋裂缝 Dope War Crack House 丛林迷你空中的冒险 MooDroid 弓箭射手卖房子的女人的逆袭七日生出师表请赐我一双翅膀网球少年海棠经雨胭脂透觉醒腾空之约全职高手雷霆战将