更新时间:2023-12-27 11:38:27
封面
版权信息
内容提要
《网络爬虫开发》编委会
前言
爬虫基础篇
项目一 初识爬虫
项目概述
思政目标
知识目标
能力目标
学习路径
学习资源
思维导图
任务一 认识网络爬虫
任务二 网络爬虫的合法性与robots协议
任务三 认识反爬虫
任务四 拓展知识
内容小结
课后习题
实施评量单
项目二 Web基础
任务一 HTTP基本原理
任务二 网页基础
任务三 会话和cookie机制
任务四 谷歌浏览器开发者工具
任务五 拓展知识
实训任务
项目三 Python语言基础
任务一 认识Python语言并搭建开发环境
任务二 Python基础语法
任务三 Python常用语句
任务四 字符串与正则表达式
任务五 列表、元组和字典
任务六 拓展知识Python函数
爬虫中阶篇
项目四 常用的网络请求库
任务一 认识HTTP请求
任务二 urllib网络请求库
任务三 requests网络请求库
任务四 拓展知识:httpx请求库
项目五 网页数据的解析提取
任务一 网络解析基础
任务二 用XPath解析网页
任务三 使用Beautiful Soup解析网页
任务四 PyQuery解析库
任务五 拓展知识:正则表达式的解析
爬虫实战篇
项目六 数据存储
任务一 数据存储在文本文件中
任务二 综合任务——“智游陕西,畅享三秦”,爬取陕西热门景点数据