考点:
☆☆☆☆考点17:分类变量资料的统计推断;
1.率的抽样误差
从同一个总体中随机抽出观察数相等的多个样本,样本率与总体率、各样本率之间往往会有差异,这种差异被称作率的抽样误差。率的抽样误差用率的标准误表示,计算公式为:
式中σP为率的标准误,π为总体的阳性率,n为样本含量。若不知道总体阳性率π则用样本阳性率P来代替,公式变为 。
2.总体率的可信区间及其估计方法
由于抽样误差是不可避免的,因此,需要按一定的概率100(1-α)%估计总体率所在的范围,该范围被称为总体率的可信区间。样本率的理论分布和样本含量n、阳性率P的大小有关,我们需要根据N和P的大小选择下列方法:
(1)正态近似法
当样本含量N足够大,样本率P或l-P均不太小时(如NP和n(1-P)均大于5),样本率的分布近似正态分布,总体率可信区间的估计由下列公式估计:总体率(π)95%的可信区间为:P±96SP:总体率(π)99%的可信区间:P±2.58SP。
(2)查表法
当n较小,如n≤50,特别是P接近于0或1时,按二项分布原理估计总体率的可信区间。
3.U检验
在样本含量n足够大、样本率P和1-P均不接近于零的前提下,样本率的分布近似于正态分布,样本率和总体率之间、两个样本率之间差异来源的判断可用u检验。
(1)样本率与总体率的比较
公式为:u=|P-π|/σP=|P-π|/
式中P为样本率,π为总体率,σP为根据总体率计算的标准误。u服从标准正态分布,故u≥1.96,P≤0.05,拒绝无效假设。
(2)两个样本率的比较 公式为:u=|P1-P2| ,式中Pc为合并样本率,Pc=(X1+X2)/(n1+n2),P1和P2为两个样本率,X1和X2分别为两个样本的阳性例数。
3.χ2检验
(1)χ2检验的适用范围
χ2检验是一种用途极广的假设检验方法,它可用于两个及两个以上率或构成比的比较;两分类变量间相关关系分析等。
(2)四格表资料的χ2检验
①四格表资料的符号及意义
若变量的观察结果表现为相互对立的两种情况时,进行两组比较,可得四个基本数据。
②χ2检验的基本原理
在抽样研究中,若总体率相等,H0:π1=π2成立,则理论上检测阳性或阴性的人数可用下式来计算。
式中TRC为R行C列的理论数。
若H0成立,每格实际数与理论数应基本接近,即 值就趋近于零。若χ2<χ2α,v时,P>a;反之若出现较大的χ2值,就表明实际数与理论数相差比较大,当χ2≥χ2α,v时,P≤α,即可认为两组间差别有统计学意义。在χ2值比较时,尚应考虑χ2自由度v,v=(R-1)(C-1)=(行数-1)(列数-1)。
(3)四格表资料X2检验方法和步骤
成组设计四格表资料X2检验
基本公式
专用公式
以上两式均要求n>40且均T>5;若n>40,但出现1<T<5的情况,宜采用校正X2值计算;
校正χ2值公式:
若n<40,或T<1时,不宜采用X2检验,应采用直接概率法。
(4)行×列表资料χ2检验
行×列表资料包括行数R>2,列数C=2;R>2,C=2和R>2.C<2等多种情况。
Copyright © 2007-至今 yijy.com,All Rights Reserved 医家园