图书 | 大数据分析与挖掘实验教程/新工科新商科大数据与商务智能系列 |
内容 | 内容推荐 本书是一本面向数据科学初学者的实验教材。本书旨在通过实验的方式,帮助学生掌握数据分析和挖掘的基本概念、方法和技术,并学会使用Python等工具进行实际操作。本书的实验设计涵盖了数据预处理、数据可视化、分类与预测、聚类与关联规则挖掘、文本挖掘、网络分析、时间序列分析、情感分析和主题模型等多个方面,旨在培养学生的数据思维和实际操作能力,为学生日后从事数据科学工作打下坚实的基础。本书的实验设计遵循理论与实践相结合的原则,每个实验都提供了详细的理论知识和实验步骤,以及实验数据和代码。通过实验,学生可以熟悉数据分析与挖掘的实际操作流程,了解各种数据分析与挖掘方法的优缺点以及应用场景。同时,本书还鼓励学生进行自主思考和创新,通过实验提高学生解决问题的能力和创新能力。 作者简介 万欣,武汉纺织大学管理学院副教授,毕业于日本电气通信大学,工学博士(社会智能信息学),主要研究方向:商务智能、机器学习、数据挖掘、推荐系统等。曾就职于国内外多家上市公司从事技术研发、软件开发工作。以第一作者发表论文十几篇,其中被SCI、EI收录十余篇。大数据分析与挖掘领域教学经验丰富。 目录 第一章 数据预处理 第一节 数据清洗 第二节 数据集成 第三节 数据变换 第四节 数据规约 第五节 Python中的数据预处理工具 小结 第二章 数据可视化 第一节 理解数据可视化的概念和重要性 第二节 使用Python的matplotlib和seaborn库绘制基本图形 第三节 绘制柱状图、折线图、散点图、箱线图等常见图形 第四节 利用图形展示数据的关系和趋势、数据的分析 第五节 利用交互式可视化工具进行第级数据可视化 小结 第三章 分类与预测 第一节 理解分类与预测的概念和应用场景 第二节 理解机器学习分类算法的基本原理 第三节 利用Python的scikit-learn库进行分类算法的实现 第四节 利用交叉验证、网格搜索等方法对分类算法进行优化 小结 第四章 聚类与关联规则挖掘 第一节 理解聚类与关联规则挖掘的概念和应用场景 第二节 理解聚类算法的基本原理 第三节 利用Python的scikit-learn库进行聚类算法的实现 第四节 理解关联规则挖掘的基本原理:Apriori算法 第五节 利用Python的mlxtend库进行关联规则挖掘的实现 小结 第五章 文本挖掘 第一节 理解文本挖掘的概念和应用场景 第二节 理解自然语言处理的基本概念及技术 第三节 利用Python的NLTK和jieba库进行文本预处理 第四节 理解文本分类的基本原理和算法 第五节 利用Python的scikit-learn和keras库进行文本分类的实现 小结 第六章 网络分析 第一节 理解网络分析的概念、应用场景和工具 第二节 理解网络的基本概念 第三节 利用Python的NetworkX库进行网络构建和分析 第四节 理解社交网络分析的基本原理和方法 第五节 利用Python的igraph库进行社交网络分析的实现 小结 第七章 时间序列分析 第一节 理解时间序列分析的概念和应用场景 第二节 理解时间序列的基本概念 第三节 利用Python的pandas库进行时间序列数据的处理和分析 第四节 理解时间序列预测的基本原理和方法 第五节 利用Python的statsmodels库进行时间序列预测的实现 小结 第八章 情感分析 第一节 理解情感分析的概念和应用场景 第二节 理解自然语言处理中的情感分析基本原理和方法 第三节 利用Python的NLTK和SnowNLP库进行情感分析的实现 第四节 理解深度学习在情感分析中的应用 第五节 利用Python的keras和tensorflow库进行深度学习情感分析的实现 小结 第九章 主题模型 第一节 理解主题模型的概念和应用场景 第二节 理解主题模型的基本原理和方法 第三节 利用Python的gensim和scikit-learn库进行主题模型的实现 第四节 理解主题模型在文本分析、信息检索和推荐系统中的应用 第五节 利用主题模型进行文本主题分析和推荐系统的实现 小结 附录A 实验环境搭建 后记 |
标签 | |
缩略图 | ![]() |
书名 | 大数据分析与挖掘实验教程/新工科新商科大数据与商务智能系列 |
副书名 | |
原作名 | |
作者 | |
译者 | |
编者 | 万欣 |
绘者 | |
出版社 | 电子工业出版社 |
商品编码(ISBN) | 9787121456909 |
开本 | 16开 |
页数 | 149 |
版次 | 1 |
装订 | 平装 |
字数 | 192 |
出版时间 | 2023-06-01 |
首版时间 | 2023-06-01 |
印刷时间 | 2023-06-01 |
正文语种 | 汉 |
读者对象 | 本科及以上 |
适用范围 | |
发行范围 | 公开发行 |
发行模式 | 实体书 |
首发网站 | |
连载网址 | |
图书大类 | |
图书小类 | |
重量 | 302 |
CIP核字 | 2023100782 |
中图分类号 | TP274 |
丛书名 | |
印张 | 10 |
印次 | 1 |
出版地 | 北京 |
长 | 259 |
宽 | 184 |
高 | 11 |
整理 | |
媒质 | |
用纸 | |
是否注音 | |
影印版本 | |
出版商国别 | |
是否套装 | |
著作权合同登记号 | |
版权提供者 | |
定价 | |
印数 | |
出品方 | |
作品荣誉 | |
主角 | |
配角 | |
其他角色 | |
一句话简介 | |
立意 | |
作品视角 | |
所属系列 | |
文章进度 | |
内容简介 | |
作者简介 | |
目录 | |
文摘 | |
安全警示 | 适度休息有益身心健康,请勿长期沉迷于阅读小说。 |
随便看 |
|
兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。