经济发展、城乡统筹、居民生活质量与生态效率耦合协调发展研究:以长三角地区为例
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第一节 一元密度函数核估计

X为一个随机变量,其密度函数fx)未知,设x1,…,xnX的样本观测值。可从经验分布函数导出密度函数的核估计,经验分布函数为:

式(2-1)中,N是观测值的数目;Iz)为指针函数;z是条件关系式,当z为真时,Iz)=1,当z为假时,Iz)=0。式(2-1)中条件关系式zxixxii点的样本观测值,当xix时,Ixix)=1,否则取值为0。

取核函数为均匀核:

则核密度估计为:

式(2-2)中,h是带宽(或平滑参数),将核函数放宽就得到一般的核密度估计:

式(2-3)中,K是核函数。

带宽h控制密度估计的平滑程度,带宽越大,估计越平滑,但估计的偏差越大。带宽的选取在密度估计中十分重要。Silverman方法是一种基于数据的自动带宽h=0.9kN1/5min{s,IQR/1.34},s是标准离差;IQR为四分位距(Interquartile Range),因子k是标准带宽变换,标准带宽变换用来调整带宽,以便对于不同核函数的密度估计有大致相当的平滑。