上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第一节 一元密度函数核估计
设X为一个随机变量,其密度函数f(x)未知,设x1,…,xn为X的样本观测值。可从经验分布函数导出密度函数的核估计,经验分布函数为:
式(2-1)中,N是观测值的数目;I(z)为指针函数;z是条件关系式,当z为真时,I(z)=1,当z为假时,I(z)=0。式(2-1)中条件关系式z为xi≤x,xi是i点的样本观测值,当xi≤x时,I(xi≤x)=1,否则取值为0。
取核函数为均匀核:
则核密度估计为:
式(2-2)中,h是带宽(或平滑参数),将核函数放宽就得到一般的核密度估计:
式(2-3)中,K是核函数。
带宽h控制密度估计的平滑程度,带宽越大,估计越平滑,但估计的偏差越大。带宽的选取在密度估计中十分重要。Silverman方法是一种基于数据的自动带宽h=0.9kN1/5min{s,IQR/1.34},s是标准离差;IQR为四分位距(Interquartile Range),因子k是标准带宽变换,标准带宽变换用来调整带宽,以便对于不同核函数的密度估计有大致相当的平滑。