搜索引擎技术与发展
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第2章 获得海量数据

网络爬虫从互联网源源不断地抓取海量信息,搜索引擎结果中的信息都来源于此。如果把互联网比喻成一个覆盖地球的蜘蛛网,那么抓取程序就是在网上爬来爬去的蜘蛛。