完美统计图:Word/PPT/Excel数据可视化宝典
上QQ阅读APP看书,第一时间看更新

1.1 数据语言的8个要素

图1-1 统计之花:格桑花

图1-1所示是格桑花,寓意“幸福吉祥”。由于格桑花有8个花瓣,而数据语言恰好有8个要素,所以,格桑花又被称为“统计之花”。

任何语言都讲究规范,数据语言也不例外。

生活中,如果有人大喊一声“来了!”听的人就要问:“谁来了?”如果有人说:“他!”,听的人就要问:“他怎么了?”

在中文里,一句话中,起码要有主语和谓语,如果缺省了其中一个,就会让人感到莫名其妙。只有“来了”,就是缺了主语;而只有“他”,就是缺了谓语。“他来了!”就是完整的一句话。当然,好奇的人还会继续追问,“他是谁呀?”“他干吗来了?”

在数据世界,主打的是数据语言。一句规范的数据语言,必须包含8个要素,如同8瓣格桑花一样,缺一不可。如果缺省一个要素,这个数据就“废了”,用这样的数据画出来的统计表和统计图,同样也是“废物”。

下面,用一问一答的形式,来玩一个扩充数的小游戏。

目标:将“833.6”扩充为一句完整的数据语言。

以下是面对833.6的一个对话。

问:833.6是什么?是833.6元,还是833.6万元?

答:哈哈,是快递量,不是钱,是大包小包的快递,不多不少,833.6亿件。

问:原来是快递量,还真不少,哪里的?

答:中国的。

问:哪一年的呢?

答:2020年啊。

问:一年有这么多快递量,我也有贡献。对了,我不是不相信你,这个数据哪来的?

答:中国国家统计局。

问:哎呀,你可不可以把833.6的来历,一口气说清楚呀,害得我一头雾水,有好处吗?

答:当然有好处,好处就是让我们长记性。

问:长记性?

答:是啊,我们要牢牢记住数据语言的8个要素。

下面,我们就来摆一摆谱。

把833.6这个数扩充为数据,也就是扩充为一句规范的数据语言,结果是这样的:中国国家统计局发布的统计公报显示:2020年,中国快递业务量达到833.6亿件。

问:这么短的一句话,就是数据语言,还包含了8个要素,在哪里,我怎么没看到?

答:让我们一起来看一看,数据语言的8个要素。

一个数据必备的8个要素,用一句规范的数据语言来表达,是这样的:根据中国国家统计局(⑧来源)发布的《2020年中国国民经济与社会发展统计公报》显示,2020年(①时间),中国(②空间)消费者(③主体)快递业务量(④数据的名称)达到833.6(⑤数据的取值,⑥计算方法)亿件(⑦计量单位)。

一个数据必备的8个要素,用一张统计表来呈现,结果详见表1-1。

表1-1 数据语言的8个要素

问:一句数据语言,真的有8个要素呢。让我好好瞧一瞧,真的一个也不能少。只是,要记住这8个要素,有什么好的记忆方法吗?

答:记住数据语言的8个要素,就像记住一朵花那么简单。

问:是吗?

答:格桑花,吉祥的花,鲜活水灵。格桑花有8个花瓣,数据语言有8个要素。“8”与“发”同音,统计学是一门发达的学问。

问:8瓣格桑花,8个统计要素组成一句完整的数据语言,好有意思。还有什么好记的方法吗?

答:好记的方法很多。比如“4W”方法,也就是“when-where-who-what”的方法。这种方法,用“when”表示①时间,用“where”表示②空间和⑧来源,用“who”表示③主体,用“what”表示④数据的名称、⑤数据的取值、⑥计算方法和⑦计量单位。

问:平常,一看到数据,就要想到8瓣格桑花?

答:是的,一看到数据,就要问“⑧来源”,数据是不是可信;还要知道“①时间”和“②空间”,数据的出生日和诞生地;同时还要知道“③主体”,数据所讲的主角;当然还需要知道说明主体的④数据的名称、⑤数据的取值、⑥计算方法和⑦计量单位。

问:噢,记住数据语言的8个要素,想一想,也不难。一个是记住上面这样一个简单的实例,再一个就是用“8瓣格桑花”“发达”和“4W”来加强记忆。我想,我记住了,对吗?

答:不错,数据语言的8个要素,你肯定能记住。那些记不住的朋友,请想一想吧,因为自己的没记全,美丽的8瓣格桑花凋谢了,发达的统计学哭泣了,4个W也无所适从了。

问:如果不知道数据语言的8个要素,没记全数据语言的8个要素,那可就惨了!我们再来重温一下数据语言的8个要素,好吗?

答:好啊。

合:数据语言的8个要素:①时间;②空间;③主体;④数据的名称;⑤数据的取值;⑥计算方法;⑦计量单位;⑧来源。

问:对了,数学和统计学,都与数打交道,它们两个有什么区别吗?

答:问得好。它们最大的区别,就是数学上的数,可以是纯粹的数字,而统计学上的数,是数据,必须同时具备8个要素。瞧,833.6,这是数学上的数字,它在统计学的世界是根本不存在的。只有当“833.6”具备了8个统计要素,才被准许进入统计学的世界。换句话来讲,每一个数据都是有生命的,这个生命有自己的出生日和出生地,有自己的归宿,有自己的算法和结果,有自己的计量单位。

问:数据语言的8个要素,是进入统计学世界的通行证,是吗?

答:是的。用数据来编制统计表,用数据来画统计图,这8个基本要素千万不能丢。

问:如果一不留神丢了呢?

答:那就像丢了魂一样。这时,就要使出劲,喊一嗓子:“归来吧,魂兮归来!”

问:开玩笑的,8瓣格桑花是进入统计学大门的入场券,谁会随便丢掉呢?

合:数据语言的8个要素:①时间;②空间;③主体;④数据的名称;⑤数据的取值;⑥计算方法;⑦计量单位;⑧来源。

一句数据语言,8个要素,一个也不能少,除了要表达完整,还要表达规范。

【例1-1】数据语言的表达要规范。

问:“据统计局报道,19年,我国快递业务达到了635.2亿。”这样的表达是否规范?

答:上面这句数据语言,有5个地方不规范。

(1)来源没有写全,应将“统计局”写为“中国国家统计局”。

(2)年份没有写全,应将“19年”写为“2019年”。

(3)空间没有写具体,应将“我国”写为“中国”。

(4)数据的名称没有写准,应将“快递业务”写为“快递业务量”。

(5)计量单位没有写全,应将“亿”写为“亿件”。

统计表是呈现数据的常见形式,画统计图离不开统计表的数据,那么,数据语言的8个要素在统计表中是怎样分布的,下一节自有分解。