首页  软件  游戏  图书  电影  电视剧

请输入您要查询的图书:

 

图书 Python爬虫开发从入门到实战(微课版)/互联网+职业技能系列
内容
内容推荐
谢乾坤著的《Python爬虫开发从入门到实战(微课版)》较为全面地介绍了定向爬虫的开发过程、各种反爬虫机制的破解方法和爬虫开发的相关技巧。全书共13章,包括绪论、Python基础、正则表达式与文件操作、简单的网页爬虫开发、高性能HTML内容解析、Pvthon与数据库、异步加载与请求头、模拟登录与验证码、抓包与中间人爬虫、Android原生App爬虫、Scrapy、Scrapy高级应用、爬虫开发中的法律和道德问题等。除第1、12、13章外的其他章末尾都有动手实践,以帮助读者巩固本章和前面章节所学的内容。针对书中的疑难内容,还配有视频讲解,以便更好地演示相关操作。
本书适合作为高校计算机类专业的教材,也适合作为网络爬虫技术爱好者的自学参考书。
目录
第1章 绪论
1.1 爬虫
1.2 爬虫可以做什么
1.2.1 收集数据
1.2.2 尽职调查
1.2.3 刷流量和秒杀
1.3 爬虫开发技术
第2章 Python基础
2.1 Python的安装和运行
2.1.1 在Windows中安装Python
2.1.2 在Mac OS中安装Python
2.1.3 在Linux中安装Python
2.2 Python开发环境
2.2.1 PyCharm介绍与安装
2.2.2 运行代码
2.3 Python的数据结构和控制结构
2.3.1 整数、浮点数和变量
2.3.2 字符串、列表、元组
2.3.3 数据的读取
2.3.4 字典与集合
2.3.5 条件语句
2.3.6 for循环与while循环
2.4 函数与类
2.4.1 函数
2.4.2 类与面向对象编程
2.5 阶段案例——猜数游戏
2.5.1 需求分析
2.5.2 核心代码构建
2.5.3 调试与运行
2.6 本章小结
2.7 动手实践
第3章 正则表达式与文件操作
3.1 正则表达式
3.1.1 正则表达式的基本符号
3.1.2 在Python中使用正则表达式
3.1.3 正则表达式提取技巧
3.2 Python文件操作
3.2.1 使用Python读/写文本文件
3.2.2 使用Python读/写CSV文件
3.3 阶段案例——半自动爬虫开发
3.3.1 需求分析
3.3.2 核心代码构建
3.3.3 调试与运行
3.4 本章小结
3.5 动手实践
第4章 简单的网页爬虫开发
4.1 使用Python获取网页源代码
4.1.1 Python的第三方库
4.1.2 requests介绍与安装
4.1.3 使用requests获取网页源代码
4.1.4 结合requests与正则表达式
4.2 多线程爬虫
4.2.1 多进程库(multiprocessing)
4.2.2 开发多线程爬虫
4.3 爬虫的常见搜索算法
4.3.1 深度优先搜索
4.3.2 广度优先搜索
4.3.3 爬虫搜索算法的选择
4.4 阶段案例——小说网站爬虫开发
4.4.1 需求分析
4.4.2 核心代码构建
4.4.3 调试与运行
4.5 本章小结
4.6 动手实践
第5章 高性能HTML内容解析
5.1 HTML基础
5.2 XPath
5.2.1 XPath的介绍
5.2.2 lxml的安装
5.2.3 XPath语法讲解
5.2.4 使用Google Chrome浏览器辅助构造XPath
5.3 Beautiful Soup4
5.3.1 BS4的安装
5.3.2 BS4语法讲解
5.4 阶段案例——大麦网演出爬虫
5.4.1 需求分析
5.4.2 核心代码构建
5.4.3 调试与运行
5.5 本章小结
5.6 动手实践
第6章 Python与数据库
6.1 MongoDB
6.1.1 MongoDB的安装
6.1.2 PyMongo的安装与使用
6.1.3 使用RoboMongo执行MongoDB命令
6.2 Redis
6.2.1 环境搭建
6.2.2 Redis交互环境的使用
6.2.3 Redis-py
6.3 MongoDB的优化建议
6.3.1 少读少写少更新
6.3.2 能用Redis不用MongoDB
6.4 阶段案例
6.4.1 需求分析
6.4.2 核心代码构建
6.4.3 调试与运行
6.5 本章小结
6.6 动手实践
第7章 异步加载与请求头
7.1 异步加载
7.1.1 AJAX技术介绍
7.1.2 JSON介绍与应用
7.1.3 异步GET与POST请求
7.1.4 特殊的异步加载
7.1.5 多次请求的异步加载
7.1.6 基于异步加载的简单登录
7.2 请求头(Headers)
7.2.1 请求头的作用
7.2.2 伪造请求头
7.3 模拟浏览器
7.3.1 Selenium介绍
7.3.2 Selenium安装
7.3.3 Selenium的使用
7.4 阶段案例
7.4.1 需求分析
7.4.2 核心代码构建
7.4.3 调试与运行
7.5 本章小结
7.6 动手实践
第8章 模拟登录与验证码
8.1 模拟登录
8.1.1 使用Selenium模拟登录
8.1.2 使用Cookies登录
8.1.3 模拟表单登录
8.2 验证码
8.2.1 肉眼打码
8.2.2 自动打码
8.3 阶段案例——自动登录果壳网
8.3.1 需求分析
8.3.2 核心代码构建
8.3.3 运行与调试
8.4 本章小结
8.5 动手实践
第9章 抓包与中间人爬虫
9.1 数据抓包
9.1.1 Charles的介绍和使用
9.1.2 App爬虫和小程序爬虫
9.2 中间人爬虫
9.2.1 mitmproxy的介绍和安装
9.2.2 mitmproxy的使用
9.2.3 使用Python定制mitmproxy
9.3 阶段案例——Keep热门
9.3.1 需求分析
9.3.2 核心代码构建
9.3.3 调试运行
9.4 本章小结
9.5 动手实践
第10章 Android原生App爬虫
10.1 实现原理
10.1.1 环境搭建
10.1.2 使用Python操纵手机
10.1.3 选择器
10.1.4 操作
10.2 综合应用
10.2.1 单设备应用
10.2.2 多设备应用(群控)
10.3 阶段案例——BOSS直聘爬虫
10.3.1 需求分析
10.3.2 核心代码构建
10.3.3 调试与运行
10.4 本章小结
1
标签
缩略图
书名 Python爬虫开发从入门到实战(微课版)/互联网+职业技能系列
副书名
原作名
作者 谢乾坤
译者
编者
绘者
出版社 人民邮电出版社
商品编码(ISBN) 9787115490995
开本 16开
页数 262
版次 1
装订 平装
字数 582
出版时间 2018-09-01
首版时间 2018-09-01
印刷时间 2018-09-01
正文语种
读者对象 普通大众
适用范围
发行范围 公开发行
发行模式 实体书
首发网站
连载网址
图书大类
图书小类
重量 402
CIP核字 2018185416
中图分类号 TP311.561
丛书名
印张 17
印次 1
出版地 北京
260
185
10
整理
媒质
用纸
是否注音
影印版本
出版商国别 CN
是否套装
著作权合同登记号
版权提供者
定价
印数
出品方
作品荣誉
主角
配角
其他角色
一句话简介
立意
作品视角
所属系列
文章进度
内容简介
作者简介
目录
文摘
安全警示 适度休息有益身心健康,请勿长期沉迷于阅读小说。
随便看

 

兰台网图书档案馆全面收录古今中外各种图书,详细介绍图书的基本信息及目录、摘要等图书资料。

 

Copyright © 2004-2025 xlantai.com All Rights Reserved
更新时间:2025/5/13 9:33:37