图书 | 大数据原理及实践 |
内容 | 内容推荐 本书针对社会需求,为信息管理与信息系统专业本科生提供大数据存储及处理方面的知识。通过系统的讲解大规模数据的存储及处理等基础知识,使学生了解分布式数据处理系统的基本思想、原理及架构;通过实际案例分析及实践,使学生掌握大数据存储及处理的技术方法,最终使学生具备参与大规模分布式数据处理系统的搭建、数据分析及处理以及数据可视化等方面的能力。 目录 第1章Hadoop生态系统简介/001 1.1大数据发展/001 1.2Hadoop平台介绍/006 1.3相关的公司/009 1.4Hadoop生态系统/011 第2章Hadoop核心组件及其基本原理/014 2.1HDFS基本原理/014 2.2MapReduce分布式计算框架/022 2.3Yarn介绍/029 第3章Hadoop环境搭建/033 3.1Linux基础/033 3.2Linux的文件系统结构/036 3.3文件类型/038 3.4Linux基本操作命令/039 3.5Linux下常用的工具软件/047 3.6Hadoop环境搭建/051 第4章Hive基本原理及安装部署/063 4.1Hive基本原理/063 4.2Hive的数据存储/064 4.3Hive的安装部署/066 第5章Hive的基本操作/070 5.1Hive的DDL(datadefinelanguage)操作/070 5.2Hive的DML(datamanagedlanguage)操作/076 5.3Hiveshell参数/093 第6章Spark基础知识/095 6.1Spark原理/095 6.2Spark架构及生态/098 6.3Spark运行流程及特点/100 6.4Spark运行模式/108 第7章SparkRDD编程/114 7.1RDD设计与运行原理/114 7.2RDD基本操作/122 7.3SparkSQL简介/132 第8章基于MLLIB机器学习/140 8.1概述/140 8.2Spark分类和预测/142 8.3决策树算法/145 8.4朴素贝叶斯算法/152 8.5回归分析与预测技术/157 8.6聚类分析/167 大数据原理及实践 8.7k-means聚类算法简介/172 8.8DBSCAN聚类算法简介/179 8.9关联规则分析简介/185 8.10Apriori算法和FPTree算法简介/188 参考文献/200 |
标签 | |
缩略图 | ![]() |
书名 | 大数据原理及实践 |
副书名 | |
原作名 | |
作者 | 张晓燕 等 |
译者 | |
编者 | |
绘者 | |
出版社 | 上海财经大学出版社 |
商品编码(ISBN) | 9787564239091 |
开本 | 16开 |
页数 | 216 |
版次 | 1 |
装订 | |
字数 | 213000 |
出版时间 | 2023-03-01 |
首版时间 | |
印刷时间 | 2023-03-01 |
正文语种 | |
读者对象 | |
适用范围 | |
发行范围 | |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | 教育考试-大中专教材-大学教材 |
图书小类 | |
重量 | |
CIP核字 | |
中图分类号 | TP274 |
丛书名 | |
印张 | |
印次 | 1 |
出版地 | |
长 | |
宽 | |
高 | |
整理 | |
媒质 | |
用纸 | |
是否注音 | |
影印版本 | |
出版商国别 | |
是否套装 | |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。