上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
4.9 图形法
图形法是数据分析的基本方法之一,通过柱形图、折线图、散点图等一系列统计图形可以直观地分析数据。图形法适合分析低维的数据。
例:表4-18是在淘宝网搜索某关键词按人气排名前220名的商品数据,使用图形法分析这些商品售价的分布。
表4-18
图4-3是基于售价分组后绘制的直方图,可以直观地观察到各个价格区间商品的数量,商品售价分布主要集中在[118,588]、[1058,1528](单位:元)两个区间。
图4-3
5上市公司季度业绩对比图标题图形法有画图空间、图形和图注三个要素。画图空间是图形的容器,图形呈现在画图空间中,如二维空间、三维空间。图形是要表达的信息的可视化结果,如线形、柱形。图注是帮助读者理解图形的标注。图注包括图标题、坐标轴、坐标轴标题、数据标签、图例,如图4-4所示。
图4-4
[1] 交易指数:根据产品交易过程中的核心指标,如订单数、买家数、支付件数、支付金额等,进行综合计算得出的数值。数值越大说明交易的热度越大,不等同于交易金额。
[2] 数据归一化是将数据映射到[0,1]区间。
[3] 熵值法的核心思想是用信息的无序度来衡量信息的效用值。信息的无序度越低(越不稳定),该信息的效用值越大。换句话说,越稳定的信息越无用。