首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 Hadoop核心技术及其在防灾减灾中的应用
内容
内容推荐
本书系统介绍了Hadoop生态系统主要组件的基本概念、特点、主要组成、运行机制及存在的问题等内容。全书共11章,内容包含大数据基本概念、大数据处理平台Hadoop、分布式文件系统HDFS、HDFS 2.0新特性、分布式计算框架MapReduce、数据仓库Hive、分布式数据库HBase、数据迁移工具Sqoop、日志采集系统Flume、NoSQL数据库及数据可视化等内容。每一部分都有相应的实验指导,以便读者更好地学习和掌握Hadoop核心技术,进一步提高实践操作能力。
本书可作为高等院校大数据、计算机类、信息管理等专业大数据课程教材,也可作为相关技术人员参考用书。
目录
第1章 大数据概述
1.1 大数据的产生背景和发展历史
1.1.1 大数据产生的背景
1.1.2 大数据的发展历程
1.2 大数据的特征
1.2.1 数据量大
1.2.2 数据类型繁多
1.2.3 处理速度快
1.2.4 价值密度低
1.2.5 真实性
1.3 大数据的影响
1.3.1 大数据对科学研究的影响
1.3.2 大数据对思维方式的影响
1.3.3 大数据对社会发展的影响
1.3.4 大数据对就业市场的影响
1.3.5 大数据对人才培养的影响
1.4 大数据关键技术
1.5 大数据计算模式
1.6 大数据的应用
1.7 人工智能、大数据、物联网、云计算之间的关系
本章小结
习题
实验1.1 VMware虚拟机中安装CentOS系统
第2章 Hadoop概述及生态系统
2.1 Hadoop概述
2.1.1 Hadoop起源
2.1.2 Hadoop的发展简史
2.1.3 Hadoop的特性
2.1.4 Hadoop的应用现状
2.1.5 Hadoop的版本
2.2 Hadoop生态系统
2.2.1 HDFS
2.2.2 HBase
2.2.3 MapReduce
2.2.4 Hive
2.2.5 Pig
2.2.6 Mahout
2.2.7 ZooKeeper
2.2.8 Flume
2.2.9 Sqoop
2.2.10 Ambari
本章小结
习题
实验2.1 CentOS 7集群环境配置
第3章 分布式文件系统HDFS
3.1 分布式文件系统介绍
3.1.1 什么是DFS
3.1.2 DFS集群架构
3.1.3 分布式文件系统的结构
3.2 HDFS简介
3.2.1 HDFS概念
3.2.2 HDFS体系结构
3.2.3 HDFS命名空间
3.2.4 HDFS通信协议
3.2.5 HDFS客户端
3.2.6 HDFS特点
3.2.7 HDFS的局限性
3.3 HDFS主要组件
3.3.1 数据块
3.3.2 名称节点
3.3.3 数据节点
3.3.4 第二名称节点
3.3.5 数据错误与恢复
3.4 HDFS的数据读写过程
3.4.1 HDFS读数据的过程
3.4.2 HDFS写数据的过程
本章小结
习题
实验3.1 完全分布式文件系统搭建
实验3.2 HDFS基本访问操作
第4章 HDFS 2.0新性
4.1 Hadoop的优化与发展
4.1.1 Hadoop 1.0的局限性与不足
4.1.2 针对Hadoop的改进与提升
4.2 HDFS 2.0的新性
4.2.1 HDFS HA
4.2.2 HDFS联邦
本章小结
习题
实验4.1 HDFS HA配置与API访问
第5章 分布式计算框架MapReduce
5.1 MapReduce概述
5.1.1 MapReduce核心思想
5.1.2 MapReduce编程模型
5.1.3 MapReduce的特点
5.1.4 MapReduce的应用场景
5.2 MapReduce的工作原理
5.2.1 MapReduce的执行过程
5.2.2 Map段工作原理
5.2.3 Shuffle过程详解
5.2.4 Reduce段工作原理
5.3 典型实例:WordCount
5.3.1 WordCount的程序任务
5.3.2 WordCount的设计思路
5.3.3 一个WordCount执行过程实例
5.4 资源管理系统YARN
5.4.1 YARN设计思想
5.4.2 YARN体系结构
5.4.3 YARN工作流程
5.4.4 YARN的发展目标
本章小结
习题
实验5.1 MapReduce并行编程基础
实验5.2 MapReduce应用实例
第6章 数据仓库Hive
6.1 数据仓库简介
6.1.1 什么是数据仓库
6.1.2 数据仓库的结构
6.2 Hive基础
6.2.1 什么是Hive
6.2.2 Hive与传统数据库的区别
6.2.3 Hive与其他组件的关系
6.2.4 Hive的特点
6.2.5 Hive系统架构
6.3 Hive工作原理
6.3.1 Hive的数据类型
6.3.2 Hive的数据模型
6.3.3 SQL语句转换成MapReduce
6.3.4 Hive工作过程
本章小结
习题
实验6.1 数据仓库工具Hive环境搭建
实验6.2 数据仓库工具Hive操作
第7章 分布式数据库HBase
7.1 HBase简介
7.1.1 什么是HBase
7.1.2 HBase与传统关系型数据库的区别
7.1.3 HBase访问接口
7.2 HBase数据模型
7.2.1 HBase基本结构
7.2.2 概念视图
7.2.3 物理视图
7.2.4 面向列的存储
7.2.5 HBase数据模型
7.3 HBase的运行机制
7.3.1 HBase系统架构
7.3.2 表和Region
7.3.3 Region的定位
7.3.4 Region服务器的工作原理
7.3.5 Store的工作原理
7.3.6 HLog的工作原理
本章小结
习题
实验7.1 分布式数据库HBase的安装与操作
第8章 数据迁移工具Sqoop
8.1 Sqoop简介
8.1.1 什么是Sqoop
8.1.2 Sqoop点
8.1.3 数据导入的方式
8.2 Sqoop工作机制
8.2.1 Sqoop基本架构
8.2.2 Sqoop import
8.2.3 Sqoop export
本章小结
习题
实验8.1 Sqoop的安装与操作
第9章 日志采集系统Flume
9.1 Flume简介
9.1.1 什么是Flume
9.1.2 Flume的特点
9.2 Flume架构
9.2.1 Flume基本架构
9.2.2 Flume的主要
标签
缩略图
书名 Hadoop核心技术及其在防灾减灾中的应用
副书名
原作名
作者
译者
编者 陈新房
绘者
出版社 北京交通大学出版社
商品编码(ISBN) 9787512151536
开本 16开
页数 329
版次 1
装订 平装
字数 544
出版时间 2024-02-01
首版时间 2024-02-01
印刷时间 2024-02-01
正文语种
读者对象 本科及以上
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 504
CIP核字 2024001161
中图分类号 TP274
丛书名
印张 21.25
印次 1
出版地 北京
260
185
13
整理
媒质
用纸
是否注音
影印版本
出版商国别
是否套装
著作权合同登记号
版权提供者
定价
印数 1000
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/19 18:49:15