更新时间:2022-07-27 19:35:37
封面
版权信息
内容简介
前言
本书内容
代码下载
致谢
第1章 大数据分析概述
1.1 大数据分析背景
1.2 大数据分析的应用
1.3 大数据分析算法
1.4 大数据分析工具
1.5 本章小结
第2章 数据特征算法分析
2.1 数据分布性分析
2.1.1 数据分布特征集中趋势的测定
2.1.2 数据分布特征离散程度的测定
2.1.3 数据分布特征偏态与峰度的测定
2.2 数据相关性分析
2.2.1 数据相关关系
2.2.2 数据相关分析的主要内容
2.2.3 相关关系的测定
2.3 数据聚类性分析
2.3.1 聚类分析定义
2.3.2 聚类类型
2.3.3 聚类应用
2.4 数据主成分分析
2.4.1 主成分分析的原理及模型
2.4.2 数据主成分分析的几何解释
2.4.3 数据主成分的导出
2.4.4 证明主成分的方差是依次递减的
2.4.5 数据主成分分析的计算
2.5 数据动态性分析
2.6 数据可视化
2.7 本章小结
第3章 大数据分析工具:NumPy
3.1 NumPy简介
3.2 NumPy环境安装配置
3.3 ndarray对象
3.4 数据类型
3.5 数组属性
3.6 数组创建例程
3.7 切片和索引
3.8 广播
3.9 数组与元素操作
3.9.1 数值迭代
3.9.2 数组变形
3.9.3 数组翻转
3.9.4 修改维度
3.9.5 数组连接
3.9.6 数组分割
3.9.7 添加/删除元素
3.10 位操作与字符串函数
3.11 数学运算函数
3.12 算术运算
3.13 统计函数
3.14 排序、搜索和计数函数
3.15 字节交换
3.16 副本和视图
3.17 矩阵库
3.18 线性代数模块
3.19 Matplotlib库
3.20 Matplotlib 绘制直方图
3.21 IO文件操作
3.22 NumPy实例:GPS定位
3.23 本章小结
第4章 大数据分析工具:SciPy
4.1 SciPy简介
4.2 文件输入和输出:SciPy.io
4.3 特殊函数:SciPy.special
4.4 线性代数操作:SciPy.linalg
4.5 快速傅里叶变换:sipy.fftpack
4.6 优化器:SciPy.optimize
4.7 统计工具:SciPy.stats
4.8 SciPy实例
4.8.1 最小二乘拟合
4.8.2 函数最小值
4.9 本章小结
第5章 大数据分析工具:Matplotlib
5.1 初级绘制
5.2 图像、子区、子图、刻度
5.3 其他种类的绘图
5.4 本章小结
第6章 大数据分析工具:Pandas
6.1 Pandas系列
6.2 Pandas数据帧
6.3 Pandas面板
6.4 Pandas快速入门
6.5 本章小结
第7章 大数据分析工具:Statsmodels与Gensim
7.1 Statsmodels
7.1.1 Statsmodels统计数据库
7.1.2 Statsmodels典型的拟合模型概述
7.1.3 Statsmodels举例
7.2 Gensim
7.2.1 基本概念
7.2.2 训练语料的预处理
7.2.3 主题向量的变换
7.2.4 文档相似度的计算
7.3 本章小结