网络爬虫开发
上QQ阅读APP看书,第一时间看更新

内容提要

本书共有八个项目,围绕网络爬虫三部曲“爬取—解析—存储”较为全面地介绍关于不同场景下利用Python爬取网络数据的基础知识和方法,让读者通过编写简单的静态爬虫和动态爬虫,使用Scrapy爬虫框架完成对爬虫理论和实践技能的学习。内容分为基础知识篇、中阶知识篇和实战篇。项目一至项目三介绍爬虫的基本概念、网页基础知识和Python基本语法等;项目四和项目五利用实例演示介绍有关爬取库、解析库等爬虫中阶知识;项目六至项目八则是实战篇,主要介绍数据存储的实例和利用动态网页爬取数据的综合案例,再次完整展现爬虫三部曲“爬取—解析—存储”,以及Scrapy爬虫框架的概念和实施。

本书面向对网络爬虫技术感兴趣的读者,介绍了使用Python语言编写爬虫的各种技巧和方法,可供大数据技术等相关专业的学生参考使用,也可作为大数据技术爱好者的自学用书。