1.1.1 学术图表的基本作用
图表在学术论文中是很重要的一部分。实验结果通常是论文的核心和主要部分,而实验结果一般以图表的形式呈现。读者经常通过图表来判断这篇文章是否值得阅读,所以每个图表都应该能不依赖正文而独立存在。所谓“一图抵千言”(A picture is worth a thousand words)。图表设计是否精确且合理直接影响数据的完整与准确表达,从而影响论文的质量。图表是期刊评审过程中仅次于摘要的关键一环,准确而美观的图表能促进审稿人和读者对论文表达的快速理解。以Nature上的文章Cotranslational signal-independent SRP preloading during membrane targeting[2]选取的前两页为例(见图1-1-2),我们首先关注的是论文的标题(title),其次是第一页最开始的摘要(abstract),接下来我们就被这些包含大量实验数据与信息的图表所吸引。在每页的文章中,包含图名(figure)的图表部分几乎占据整个页面的1/4~1/3,由此可见图表在论文中的重要性。
图1-1-2 论文摘取的页面案例[2].
根据Edward R.Tufte的The Visual Display of Quantitative Information[3]和Visual Explanations[4]的阐述,图表在论文的作用主要有:
(1)真实、准确、全面地展示数据;
(2)以较小的空间承载较多的信息;
(3)揭示数据的本质、关系、规律。
第三点作用尤为重要,Matthew O. Ward也提出,可视化的终极目标是洞悉蕴含在数据中的现象和规律,这包括多重含义:发现、决策、解释、分析、探索和学习[5]。表1-1-1所示的原始数据是31组x-y的二维数据。仅仅只从数据的角度去观察数据,就很难发现x与y之间的具体关系。将实际的数据分布情况使用二维可视化的方法呈现,如图1-1-3所示,则可以快速地从数据中发现数据内在的模式与规律。所以,有时使用数据可视化的方法也可以很好地帮助我们去分析数据。
表1-1-1 四组二维数据点集(相同的x变量,不同的y变量:y1,y2,y3,y4)
图1-1-3 四个不同规律的二维数据点集的可视化案例