一組調(diào)查或?qū)嶒?yàn)數(shù)據(jù),如果是計(jì)量資料可求得平均數(shù),標(biāo)準(zhǔn)差等統(tǒng)計(jì)指標(biāo),如果是計(jì)數(shù)資料則求百分率藉以概括說(shuō)明這群觀察數(shù)據(jù)的特征,故稱特征值。由于樣本特征值是通過(guò)統(tǒng)計(jì)求得的,所以又稱為統(tǒng)計(jì)量以區(qū)別于總體特征值?傮w特征值一般稱為參數(shù)(總體量)。我們進(jìn)行科研所要探索的是總體特征值即總體參數(shù),而我們得到的卻是樣本統(tǒng)計(jì)量,用樣本統(tǒng)計(jì)量估計(jì)或推論總體參數(shù)的過(guò)程叫參數(shù)估計(jì)。
本章第一節(jié)例6.1通過(guò)檢查110個(gè)健康成人的尿紫質(zhì)算得陽(yáng)性率為10%,這是樣本率,可用它來(lái)估計(jì)總體率,說(shuō)明健康成人的尿紫質(zhì)陽(yáng)性率水平,這樣的估計(jì)叫“點(diǎn)估計(jì)”。但由于存在抽樣誤差,不同樣本(如再檢查110人)可能得到不同的估計(jì)值。因此我們常用“區(qū)間估計(jì)”總體率(或總體均數(shù))大概在那一個(gè)范圍內(nèi),這個(gè)范圍就叫可信區(qū)間。區(qū)間小的一端叫下限,大的一端叫上限。常用的有95%可信區(qū)www.med126.com間與99%可信區(qū)間。根據(jù)同一資料所作95%可信區(qū)間比99%可信區(qū)間窄些(上、下限較靠近),但估計(jì)錯(cuò)誤的概率后者為1%,前者為5%,進(jìn)行總體參數(shù)的區(qū)間估計(jì)時(shí)可根據(jù)研究目的與標(biāo)準(zhǔn)誤的大小選用95%、或99%。
為了說(shuō)明常用的總體均數(shù)之區(qū)間估計(jì)法,我們不妨回顧一下上節(jié)所敘的t分布。
由求t的基本公式
我們看到X與μ的距離等于t(SX),又根據(jù)X集中分布在μ周圍的特點(diǎn),若取t的5%
界即t0.05,,(或1%界)乘以SX作為X與μ的距離范圍,就可用式(6.6)或式(6.7)求
出區(qū)間來(lái)估計(jì)總體均數(shù)μ所在范圍,估錯(cuò)的概率僅有5%或1%,因此稱95%或99%可信區(qū)間。下面用實(shí)例說(shuō)明其求法。
95%可信區(qū)間 X-t0.05,νSX<μ<X+T0.05,ΝSX(6.6)
99%可信區(qū)間 X-t0.05,νSX<μ<X+T0.01,ΝSX(6.7)
例6.2 上面抽樣實(shí)驗(yàn)中第1號(hào)樣本的均數(shù)為488.6,標(biāo)準(zhǔn)差為61.65,例數(shù)10,自由度ν=10-1=9,試求95%與99%可信區(qū)間。
1.求標(biāo)準(zhǔn)誤
95%可信區(qū)間 488.6-2.262(19.50)<μ<488.6+2.262(19.50),即有95%的把握估計(jì)μ是在444.49~532.71區(qū)間內(nèi)
99%可信區(qū)間 488.6-3.250(19.50)<μ<488.6+3.250(19.50),可有99%的把握估計(jì)μ是在425.22~551.98區(qū)間內(nèi)
這里兩個(gè)可信區(qū)間都包含μ=500在內(nèi),所以這次估計(jì)是估計(jì)對(duì)了。
抽樣實(shí)驗(yàn)共抽了100個(gè)樣本,除1號(hào)樣本外其余99個(gè)樣本均數(shù)也對(duì)μ作了區(qū)間估計(jì),這些95%可信區(qū)間列在表6.4中。我們看到,只有5個(gè)95%可信區(qū)間(右上角標(biāo)有星號(hào))不包含總體均數(shù)μ=500在內(nèi),它們是:
樣本號(hào) | X | 95%可信區(qū)間 |
6 | 546.7 | 515.78~577.62 |
7 | 524.5 | 500.45~548.55 |
28 | 476.1 | 454.91~497.29 |
72 | 465.3 | 447.02~483.58 |
75 | 526.6 | 503.10~550.10 |
平時(shí)我們并不重復(fù)抽取許多樣本來(lái)一次次估計(jì)總體均數(shù)而僅是一次,至于算出的均數(shù)會(huì)類似一百個(gè)樣本均數(shù)中的那一個(gè)就很難說(shuō)了。如果不遇到類似上列那些均數(shù)過(guò)大或過(guò)小的樣本,求出可信區(qū)間后總體均數(shù)真是在該區(qū)間內(nèi),那么便是一次成功的估計(jì):但是極少數(shù)情況下我們也會(huì)遇到極端的樣本,以至總體均數(shù)并不在我們提出的區(qū)間內(nèi)。不過(guò),我們具體所作的這次估計(jì)到底屬于前種情況還是后一種,這是無(wú)法知道的,因?yàn)槲覀儾恢捆淌嵌嗌伲ㄈ粢阎瘫悴槐毓烙?jì)它了)。然而象后種情況那樣作出錯(cuò)估的概率終究很小,只5%或1%,所以用這樣的方法估計(jì)總體均數(shù)還是可行的。
上面已經(jīng)提到,計(jì)數(shù)資料可以計(jì)算相對(duì)數(shù)(率)。我們?nèi)粲蓸颖窘y(tǒng)計(jì)量P估計(jì)總體參數(shù)π,同樣要考慮率的抽樣誤差,據(jù)數(shù)理統(tǒng)計(jì)研究結(jié)果,樣本率的分布也近似正態(tài)分布,尤其當(dāng)π比較靠近50%且樣本較大時(shí)。于是對(duì)樣本,百分率的可信區(qū)間可利用正態(tài)分布規(guī)律估計(jì),公式是:
95%可信區(qū)間 P-1.96Sp<π
99%可信區(qū)間 P-2.58Sp<π
(按正態(tài)分布,雙側(cè)尾部面積α=0.05時(shí)的u值為1.96,α=0.01時(shí)的u值為2.58,故用這兩式求可信區(qū)間時(shí)不必查表找臨界u值,記住這兩數(shù)即可。)
例6.3 某醫(yī)院收治200例急性菌痢患者,其中糞便細(xì)菌培養(yǎng)陽(yáng)性者共80例,試估計(jì)菌痢細(xì)菌培養(yǎng)的總體陽(yáng)性率95%與99%可信區(qū)間。
1.求陽(yáng)性率 P=80/200×100%=40%。ɑ0.40)
www.med126.com3.求可信區(qū)間
95%可信區(qū)間 40%-1.96(3.46%)<π<40%+1.96(3.46%),即估計(jì)π在33.22%~46.78%之間
99%可信區(qū)間 40%-2.58(3.46%)<π<40%+2.58(3.46%),即估計(jì)π在31.07%~48.93%之間
如果是小樣本的百分率,求可信區(qū)間可通過(guò)查表獲得,附表4是n為10、15、20、30時(shí)查95%與99%可信區(qū)間的一個(gè)簡(jiǎn)表。此外,統(tǒng)計(jì)學(xué)專著中還有更詳細(xì)的表可查。