1.4 四种典型抽样方法
在生产实践中,抽取样本的方法很多,但总的要求应该是随机抽样,即不挑肥拣瘦,使得总体中的每个个体都有相同的被抽到的机会。概括起来讲,随机抽样有以下四种典型方法:
一是简单随机抽样(simple random sampling)。常采用随机表、抽签、掷骰子等办法产生随机数完成样本取样,这种方法使得每个个体被抽到的机会相同。例如,在50件产品中抽4件,先将产品从1到50编号,再根据产生的随机数如11、46、32、34确定抽样样本。该方法抽样误差小,但抽样手续繁杂。单位搞联欢活动时组织抽奖,常采用抽签方法,每个人先抽取一个号,摇奖时出现的号就是中奖号。
二是分层抽样(stratified sampling)。将总体按照人、机、料、法、环等因素进行分层后,再从各层中按一定的比例抽取样本。例如,工人在相同机器上倒班生产同一种零件,加工的零件堆放在两处,若要抽取10个零件,应从这两堆中分别随机抽取5件。该方法抽取的样本具有较好的代表性,抽样误差小,但手续较繁。这一方法常用于来料检验中,采用此法往往能发现批次性质量问题。
三是整群抽样(cluster sampling)。将总体按一定方式分成若干群,随机抽取若干群,由这些群中的所有个体组成样本。例每隔3小时抽出其中5分钟内的产品作为样本,或每隔1小时一次抽取10个产品组成样本。该方法简捷,常用于流水线过程控制抽样,但样本代表性较差。
四是系统抽样(systematic sampling)。按照一定的时间或空间间隔取样,又称等距抽样法或机械抽样法。例如,每隔2小时或每隔20匹布抽取一个样本等。该方法操作简便,实施起来不易出错,故广泛应用于生产现场的抽样。但因系统抽样的抽样起点决定了整个样本,故该方法不易发现周期性质量问题。如一台织布机出了毛病,恰好是每隔20匹布(周期性)出现一段疵布,若检验人员第一次抽样起点没有发现这个问题,以后每次抽样便都发现不了。因此当间隔周期恰好是出现故障的周期时,该方法易失效,改进的办法是不断变化间隔周期。
在质量管理参考书[1]中,有这样一个比较经典的抽样案例,为便于读者区别上述4种抽样方法,在此介绍给读者。
【例1】 假设某种成品零件分别装在20个零件箱中,每箱各装50个,共计1000个。若想从中抽取100个组成样本进行测试,问应如何运用上述四种抽样方法?
解:将20箱零件倒在一起,混合均匀,并将零件从0-999逐一编号,后用查随机数表或抽签办法从中抽出编号毫无规律的100个零件组成样本,此即简单随机抽样;对所有20箱零件,每箱都随机抽出5个零件,共100件组成样本,此即分层抽样;先从20箱零件随机抽出2箱作为整群,后将这两箱零件全部作为样本,此即整群抽样;将20箱零件倒在一起,混合均匀,对零件从1-1000逐一编号,后查随机数表或抽签先决定起始编号,比如16号,则入选样本的零件编号依次为26,36,46, ……,986,996,06,此即系统抽样(等距抽样)。