Python数据预处理技术与实践
上QQ阅读APP看书,第一时间看更新

2.4 本章小结

本章介绍了数据预处理中常用的Python科学工具包NumPy、SciPy和Pandas,系统地学习了这些包的概念和使用。NumPy工具包中的数学函数和线性代数知识,对于科研和阅读文献非常有帮助,IO和数组操作也是在文本处理中常见的。SciPy工具包常用于算法优化和实验结果分析等方面。Pandas工具包对缺失值、稀疏值处理方面较为擅长。下一章将介绍数据采集与存储以及使用Scrapy实现爬取数据并存储在MySQL数据库中等知识。