更新时间:2023-08-10 16:24:35
封面
版权信息
内容简介
作者简介
前言PREFACE
第1章 Pandas数据处理环境搭建
1.1 Pandas环境配置
1.1.1 安装Python发行版本Anaconda
1.1.2 程序编写工具Jupyter Notebook
1.2 Python基础操作
1.2.1 变量
1.2.2 注释
1.2.3 代码缩进
1.2.4 数据结构
1.2.5 控制语句
1.2.6 函数
第2章 Pandas中数据的存取
2.1 读取Excel文件数据
2.2 读取CSV文件数据
2.3 保存为Excel文件格式
2.4 保存为CSV文件格式
2.5 Pandas中表格的结构
2.5.1 DataFrame数据结构
2.5.2 Series数据结构
第3章 NumPy数据处理基石
3.1 NumPy的定义
3.2 NumPy数组的创建与转换
3.2.1 普通数组
3.2.2 序列数组
3.2.3 随机数组
3.2.4 转换数组
3.3 NumPy数组的预处理
3.3.1 类型转换
3.3.2 缺失值处理
3.3.3 重复值处理
3.4 NumPy数组维度转换
3.4.1 数组维度转换
3.4.2 数组合并
3.5 Series数据的创建
3.6 DataFrame表格的创建
3.6.1 使用NumPy数组创建DataFrame表格
3.6.2 使用Python列表创建DataFrame表格
3.6.3 使用Python字典创建DataFrame表格
第4章 表格管理技术
4.1 表格属性获取与修改
4.1.1 表格属性的获取
4.1.2 表格属性修改
4.2 表格的切片选择
4.2.1 切片法
4.2.2 筛选法
4.2.3 loc切片法
4.2.4 iloc切片法
4.3 添加表格的行和列
4.3.1 添加行
4.3.2 添加列
4.4 删除表格的行和列
4.4.1 删除行
4.4.2 删除列
4.4.3 删除有缺失值的行和列
4.5 表格数据的修改
4.6 巩固案例
第5章 数据处理基础
5.1 数据运算处理
5.1.1 运算符与运算函数
5.1.2 Series与单值的运算
5.1.3 DataFrame与单值运算
5.1.4 Series与Series运算
5.1.5 DataFrame与DataFrame运算
5.1.6 DataFrame与Series运算
5.1.7 数据运算时的对齐特性
5.2 数据分支判断
5.2.1 条件判断处理1(mask()与where())
5.2.2 条件判断处理2(np.where())
5.3 数据遍历处理
5.3.1 遍历Series元素(map())
5.3.2 遍历DataFrame行和列(apply())
5.3.3 遍历DataFrame元素(applymap())
5.4 数据统计处理
5.4.1 聚合统计
5.4.2 逻辑统计
5.4.3 极值统计
5.4.4 排名统计
5.5 巩固案例
5.5.1 根据不同蔬菜的采购数量统计每天采购金额
5.5.2 筛选出成绩表中各科目均大于或等于100的记录
5.5.3 筛选出成绩表中各科目的和大于或等于300的记录
5.5.4 统计每个人各科目总分之和的排名
5.5.5 统计每个人所有考试科目的最优科目
第6章 字符串清洗技术
6.1 正则
6.1.1 正则表达式的导入与创建
6.1.2 正则表达式处理函数
6.1.3 正则表达式编写规则
6.2 拆分
6.2.1 普通拆分
6.2.2 正则拆分
6.2.3 拆分次数
6.2.4 拆为表格
6.2.5 实例应用
6.3 提取