《Python文本分析》(美)延斯·阿尔布雷希特//西达尔特·拉马钱德兰//克里斯蒂安·温克勒中国电力出版社PDF电子书网盘迅雷下载、免费在线阅读-兰台网

图书

Python文本分析

内容

内容推荐

将文本转换成有价值的信息是企业寻求竞争优势的关键。随着近年来自然语言处理（NLP）的发展，如今用户可以通过各种方式来解决复杂的难题。但用户不清楚选择何种NLP工具或库才能满足业务需求，他们不知道应该使用何种技术以及按照怎样的顺序使用这些技术。
这本实战手册为数据科学家和开发人员提供了文本分析与自然语言处理中常见任务的最佳实践解决方案。书中介绍了各种Python真实案例研究，并提供了详细的代码示例，可以帮助你快速入门。
提取API与网页的数据。
统计分析和机器学习的文本数据预处理。
机器学习分类、主题建模与摘要。
解释Al模型与分类的结果。
利用单词嵌入，探索及可视化语义相似性。
分析产品评论中的客户情感。
根据命名实体及其关系创建知识图。

作者简介

延斯·阿尔布雷希特（Jens Albrecht）是纽伦堡理工学院计算机科学系的全职教授。主要从事数据管理与分析领域的研究，尤其侧重于文本分析。

前言
第1章洞悉文本数据
1.1 本章内容概要
1.2 探索性数据分析
1.3 数据集简介
1.4 案例：使用Pandas获取数据概要
1.4.1 计算列的汇总统计结果
1.4.2 检查缺少的数据
1.4.3 绘制值的分布图
1.4.4 比较各个类别的分布
1.4.5 可视化一段时间内的变化
1.5 案例：构建简单的文本预处理流水线
1.5.1 使用正则表达式分词
1.5.2 删除停用词
1.5.3 通过一行代码处理流水线
1.6 词频分析案例
1.6.1 案例：使用Counter统计单词个数
1.6.2 案例：创建词频图
1.6.3 案例：创建词云
1.6.4 案例：TF-IDF排名
1.7 案例：查找上下文关键字
1.8 案例：n元语法分析
1.9 案例：比较不同时间段和类别的词频
1.9.1 创建词频时间表
1.9.2 创建词频热图
1.10 小结
第2章利用API提取文本
2.1 本章内容概要
2.2 应用程序编程接口
2.3 案例：使用requests模块通过API提取数据
2.3.1 分页
2.3.2 速率限制
2.4 案例：使用Tweepy提取推特数据
2.4.1 获取凭证
2.4.2 安装与配置Tweepy
2.4.3 通过Search API提取数据
2.4.4 从用户的时间线中提取数据
2.4.5 通过流API提取数据
2.5 小结
第3章网页抓取与数据提取
3.1 本章内容概要
3.2 抓取网页与提取数据
3.3 路透社新闻存档简介
3.4 URL生成
3.5 案例：下载和解读robots.txt
3.6 案例：从sitemap.xml中寻找URL
3.7 案例：通过RSS查找URL
3.8 下载数据
3.9 案例：使用Python下载HTML页面
3.10 案例：利用wget下载HTML页面
3.11 提取半结构化数据
……
第4章准备统计和机器学习的文本数据
第5章特征工程与句法相似性
第6章文本分类算法
第7章解释文本分类器
第8章非监督学习：主题建模与聚类
第9章文本摘要
第10章通过单词嵌入探索语义关系
第11章文本数据的情感分析
第12章知识图谱
第13章文本分析的生产应用

标签

缩略图

书名

Python文本分析

副书名

原作名

作者

(美)延斯·阿尔布雷希特//西达尔特·拉马钱德兰//克里斯蒂安·温克勒

译者

译者:马晶慧

编者

绘者

出版社

中国电力出版社

商品编码（ISBN）

9787519864446

开本

16开

页数

421

版次

装订

平装

字数

565

出版时间

2022-08-01

首版时间

2022-08-01

印刷时间

2022-08-01

正文语种

汉

读者对象

普通大众

适用范围

发行范围

公开发行

发行模式

实体书

首发网站

连载网址

图书大类

图书小类

重量

652

CIP核字

2022016352

中图分类号

TP274

丛书名

印张

27.5

印次

出版地

北京

长

232

宽

177

高

整理

媒质

用纸

是否注音

影印版本

出版商国别

是否套装

著作权合同登记号

版权提供者

定价

印数

3000

出品方

作品荣誉

主角

配角

其他角色

一句话简介

立意

作品视角

所属系列

文章进度

内容简介

作者简介

文摘

安全警示

适度休息有益身心健康，请勿长期沉迷于阅读小说。

随便看

兰台网图书档案馆全面收录古今中外各种图书，详细介绍图书的基本信息及目录、摘要等图书资料。