更新时间:2024-06-11 13:22:20
封面
版权信息
文前
内容简介
前言
第1章 数据分析基础
1.1 什么是数据分析
1.2 数据分析的重要性
1.3 数据分析的基本流程
1.3.1 熟悉工具
1.3.2 明确目的
1.3.3 获取数据
1.3.4 数据处理
1.3.5 数据分析
1.3.6 验证结果
1.3.7 结果呈现
1.3.8 数据应用
1.4 数据分析的常用工具
1.4.1 Excel工具
1.4.2 Python语言
1.5 小结
第2章 搭建Python数据分析环境
2.1 快速了解Python
2.1.1 Python简介
2.1.2 Python的版本
2.1.3 Python的应用领域
2.2 搭建Python开发环境
2.2.1 下载和安装Python
2.2.2 第一个Python程序“hello world”
2.3 集成开发环境PyCharm
2.3.1 下载PyCharm
2.3.2 安装PyCharm
2.3.3 运行PyCharm
2.3.4 在PyCharm中创建一组学生成绩数据
2.4 数据分析标准环境Anaconda
2.4.1 下载Anaconda
2.4.2 安装Anaconda
2.5 Jupyter Notebook开发工具
2.5.1 认识Jupyter Notebook
2.5.2 新建一个Jupyter Notebook文件
2.5.3 在Jupyter Notebook中绘制7日天气走势图
2.6 小结
第3章 Pandas入门
3.1 认识Pandas
3.1.1 什么是Pandas
3.1.2 Pandas的功能与优势
3.1.3 安装Pandas模块
3.1.4 牛刀小试——轻松导入Excel数据
3.2 Series对象
3.2.1 图解Series对象
3.2.2 创建一个Series对象
3.2.3 手动设置Series对象的索引
3.2.4 Series对象的索引
3.2.5 获取Series对象的索引和值
3.3 DataFrame对象
3.3.1 图解DataFrame对象
3.3.2 创建一个DataFrame对象
3.3.3 DataFrame对象的重要属性和函数
3.4 外部数据读取
3.4.1 读取Excel文件
3.4.2 读取CSV文件
3.4.3 读取文本文件
3.4.4 读取HTML网页数据
3.5 数据抽取
3.5.1 抽取一行数据
3.5.2 抽取多行数据
3.5.3 抽取指定列数据
3.5.4 抽取指定行列数据
3.5.5 按指定条件抽取数据
3.6 数据的增加、修改和删除
3.6.1 增加数据
3.6.2 修改数据
3.6.3 删除数据
3.7 数据清洗
3.7.1 缺失值查看与处理
3.7.2 重复值处理
3.7.3 异常值的检测与处理
3.8 索引设置
3.8.1 索引的作用
3.8.2 重新设置索引
3.8.3 设置某列为行索引
3.8.4 数据清洗后重新设置连续的行索引
3.9 数据排序与排名
3.9.1 数据排序
3.9.2 数据排名
3.10 小结
第4章 Pandas进阶
4.1 数据计算
4.1.1 求和(sum()方法)
4.1.2 求均值(mean()方法)
4.1.3 求最大值(max()方法)
4.1.4 求最小值(min()方法)
4.1.5 求中位数(median()方法)
4.1.6 求众数(mode()方法)
4.1.7 求方差(var()方法)
4.1.8 求标准差(std()方法)
4.1.9 求分位数(quantile()方法)
4.2 数据格式化
4.2.1 设置小数位数
4.2.2 设置百分比