x2檢驗(yàn)(chi-square test)或稱(chēng)卡方檢驗(yàn),是一種用途較廣的假設(shè)檢驗(yàn)方法?梢苑譃槌山M比較(不配對(duì)資料)和個(gè)別比較(配對(duì),或同一對(duì)象兩種處理的比較)兩類(lèi)。
一、四格表資料的x2檢驗(yàn)
例20.7某醫(yī)院分別用化學(xué)療法和化療結(jié)合放射治療卵巢癌腫患者,結(jié)果如表20-11,問(wèn)兩種療法有無(wú)差別?
表20-11 兩種療法治療卵巢癌的療效比較
組別 | 有效 | 無(wú)效 | 合計(jì) | 有效率(%) |
化療組 | 19 | 24 | 43 | 44.2 |
化療加放療組 | 34 | 10 | 44 | 77.3 |
合計(jì) | 53 | 34 | 87 | 60.9 |
表內(nèi)用虛線(xiàn)隔開(kāi)的這四個(gè)數(shù)據(jù)是整個(gè)表中的基本資料,其余數(shù)據(jù)均由此推算出來(lái);這四格資料表就專(zhuān)稱(chēng)四格表(fourfold table),或稱(chēng)2行2列表(2×2 contingency table)從該資料算出的兩種療法有效率分別為44.2%和77.3%,兩者的差別可能是抽樣誤差所致,亦可能是兩種治療有效率(總體率)確有所不同。這里可通過(guò)x2檢驗(yàn)來(lái)區(qū)別其差異有無(wú)統(tǒng)計(jì)學(xué)意義,檢驗(yàn)的基本公式為:
公式(20.12)
式中A為實(shí)際數(shù),以上四格表的四個(gè)數(shù)據(jù)就是實(shí)際數(shù)。T為理論數(shù),是根據(jù)檢驗(yàn)假設(shè)推斷出來(lái)的;即假設(shè)這兩種卵巢癌治療的有效率本無(wú)不同,差別僅是由抽樣誤差所致。這里可將兩種療法合計(jì)有效率作為理論上的有效率,即53/87=60.9%,以此為依據(jù)便可推算出四格表中相應(yīng)的四格的理論數(shù)。茲以表20-11資料為例檢驗(yàn)如下。
檢驗(yàn)步驟:
1.建立檢驗(yàn)假設(shè):
H0:π1=π2
H1:π1≠π2
α=0.05
2.計(jì)算理論數(shù)(TRC),計(jì)算公式為:
TRC=nR.nc/n 公式(20.13)
式中TRC是表示第R行C列格子的理論數(shù),nR為理論數(shù)同行的合計(jì)數(shù),nC為與理論數(shù)同列的合計(jì)數(shù),n為總例數(shù)。
第1行1列: 43×53/87=26.2
第1行2列: 43×34/87=16.8
第2行1列: 44×53/87=26.8
第2行2列: 4×34/87=17.2
以推算結(jié)果,可與原四項(xiàng)實(shí)際數(shù)并列成表20-12:
表20-12 兩種療法治療卵巢癌的療效比較
組別 | 有效 | 無(wú)效 | 合計(jì) |
化療組 | 19(26.2) | 24(16.8) | 43 |
化療加放療組 | 34(26.8) | 10(17.2) | 44 |
合計(jì) | 53 | 34 | 87 |
因?yàn)樯媳砻啃泻兔苛泻嫌?jì)數(shù)都是固定的,所以只要用TRC式求得其中一項(xiàng)理論數(shù)(例如T1.1=26.2),則其余三項(xiàng)理論數(shù)都可用同行或同列合計(jì)數(shù)相減,直接求出,示范如下:
T1.1=26.2
T1.2=43-26.2=16.8
T2.1=53-26.2=26.8
T2.2=44-26.2=17.2
3.計(jì)算x2值 按公式20.12代入
4.查x2值表求P值
在查表之前應(yīng)知本題自由度。按x2檢驗(yàn)的自由度v=(行數(shù)-1)(列數(shù)-1),則該題的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本題x2=10.01即x2>x20.001(1),P<0.01,差異有高度統(tǒng)計(jì)學(xué)意義,按α=0.05水準(zhǔn),拒絕H0,可以認(rèn)為采用化療加放療治療卵巢癌的療效比單用化療佳。
通過(guò)實(shí)例計(jì)算,讀者對(duì)卡方的基本公式有如下理解:若各理論數(shù)與相應(yīng)實(shí)際數(shù)相差越小,x2值越小;如兩者相同,則x2值必為零,而x2永遠(yuǎn)為正值。又因?yàn)槊恳粚?duì)理論數(shù)和實(shí)際數(shù)都加入x2值中,分組越多,即格子數(shù)越多,x2值也會(huì)越大,因而每考慮x2值大小的意義時(shí)同時(shí)要考慮到格子數(shù)。因此自由度大時(shí),x2的界值也相應(yīng)增大。