1.1 什么是数理统计
在自然界和现实生活中,一方面,由于事物之间相互联系,有些现象在一定条件下必定会导致某种确定的结果。比如,在标准大气压下,水在零摄氏度会结冰。再比如,从地球上看,太阳每天从东方升起。事物间的这种联系属于必然性,我们把这种现象称为确定性现象。自然科学中许多学科就是专门研究和认识这种必然性规律的科学。另一方面,由于事物之间相互影响,有些现象在一定条件下其结果又是不确定的。比如,选手虽然瞄准靶心射击,但不能保证每一枪都能命中10环。再比如,播下的种子不一定都能发芽。事物间的这种联系属于偶然性,我们把这种现象称为随机现象。
随机现象普遍存在于自然界和现实生活中。例如,同一个工人在同一台机床上用同一种材料加工的同一种零件、每期彩票的中奖号码、同一批次灯泡的寿命等总会有差异。随机现象这种结果的不确定性是由于一些次要的偶然性因素影响造成的。
从表面上看,随机现象似乎杂乱无章,没有什么规律,但实践证明,如果同类的随机现象大量重复出现,它的总体就会呈现出一定的规律性。大量同类随机现象所呈现的这种规律性,随着试验观察次数的增多而愈加明显。比如掷硬币,每次投掷前很难判断结果是哪一面朝上,但如果多次重复地抛掷这枚硬币,就会越来越清楚地发现正、反面朝上的次数大体相同。我们把这种由大量同类随机现象所呈现出的总体规律,叫做统计规律。
概率论是数学的一个分支,是以排列组合、集合论等为基础研究某一特定事项发生概率的科学,是根据大量同类随机现象的统计规律,对随机现象出现某一结果的可能性从数量上做出一种客观的科学判断,从而形成的一整套数学理论和方法。
数理统计又是概率论的一个分支,是在概率论的基础上发展起来的,它以概率论为理论工具,研究如何有效地收集、整理和分析随机现象中的数据,确定随机现象中的统计规律,并通过样本对所考察的问题做出推断的科学。由于随机现象的统计规律必须在大量同类随机现象中才能呈现出来,所以在通过对样本数据进行分析,进而推断总体所呈现的规律时,抽取的样本必须足够多,以充分体现总体规律。