一、概述
正確的診斷在臨床工作中意義重大,它是選擇針對(duì)性防治措施的基礎(chǔ)。臨床醫(yī)師應(yīng)當(dāng)研究和掌握現(xiàn)有診斷試驗(yàn)的特性和臨床價(jià)值,以指導(dǎo)臨床應(yīng)用。隨著自然科學(xué)的進(jìn)展,新的診斷試驗(yàn)日益增多。為了提高診斷水平,應(yīng)研究和評(píng)價(jià)這些新的診斷試驗(yàn),以確定其能否取代或充實(shí)現(xiàn)有的診斷方法和能否推廣。本章所討論的診斷試驗(yàn)含義是廣泛的,它包括各種化驗(yàn)室檢查,詢(xún)問(wèn)病史,體檢所獲得的資料以及各種影像診斷和儀器診斷等。
診斷試驗(yàn)主要應(yīng)用于疾病診斷、疾病隨訪(fǎng)、療效考核以及藥物毒副作用的監(jiān)測(cè)。根據(jù)不同的目的選擇適當(dāng)?shù)脑\斷試驗(yàn)。一般說(shuō)來(lái),臨床醫(yī)師經(jīng)過(guò)一定期限的臨床實(shí)踐以后,都積累了選擇診斷試驗(yàn)的經(jīng)驗(yàn)。但單憑經(jīng)驗(yàn)難免不夠穩(wěn)妥,有時(shí)可以耽誤診斷,未能給患者及時(shí)有效的治療,甚至造成不可彌補(bǔ)的損失。掌握科學(xué)的研究和評(píng)價(jià)診斷試驗(yàn)的方法可為其選擇合理的診斷方法奠定基礎(chǔ),同時(shí)可避免單憑經(jīng)驗(yàn)造成的錯(cuò)誤。
一般說(shuō)來(lái),臨床醫(yī)師須在較長(zhǎng)時(shí)間內(nèi)多次使用某項(xiàng)診斷方法,而且在患同種疾病但不同類(lèi)型的病例身上使用后方可對(duì)其性質(zhì)和實(shí)用價(jià)值有較深入的理解。掌握科學(xué)的研究方法就可縮短上述過(guò)程。從文獻(xiàn)中人們不難看到,當(dāng)推出一項(xiàng)新診斷試驗(yàn)時(shí),研究人員對(duì)該項(xiàng)試驗(yàn)倍加稱(chēng)贊,但使用一段時(shí)間后,發(fā)現(xiàn)其診斷價(jià)值并不理想,因此只有不斷地積累經(jīng)驗(yàn),才能對(duì)它有較全面的認(rèn)識(shí)。如開(kāi)始在臨床上應(yīng)用癌胚抗原時(shí),人們認(rèn)為它診斷結(jié)腸癌非常有價(jià)值,但后來(lái)發(fā)現(xiàn)這種抗原在其他癌癥也會(huì)出現(xiàn),甚至在近20%未患癌癥的吸煙者中也呈陽(yáng)性。應(yīng)當(dāng)說(shuō),開(kāi)始在臨床上應(yīng)用時(shí),研究人員并非有意夸大其效率,而是在當(dāng)時(shí)缺乏科學(xué)的研究和評(píng)價(jià)方法。
二、診斷試驗(yàn)的研究方法和評(píng)價(jià)指標(biāo)
。ㄒ)診斷試驗(yàn)的研究方法
1.須同標(biāo)準(zhǔn)診斷方法(金標(biāo)準(zhǔn),gold standard)進(jìn)行盲法比較。標(biāo)準(zhǔn)診斷方法是指可靠的,公認(rèn)的診斷方法,它能正確地區(qū)分有病和無(wú)病。臨床上常用的標(biāo)準(zhǔn)診斷方法包括病理學(xué)檢查,外科手術(shù)所見(jiàn)以及長(zhǎng)期隨訪(fǎng)病例所獲得的肯定結(jié)論。例如,診斷冠心病的標(biāo)準(zhǔn)診斷方法是冠狀動(dòng)脈造影,診斷腎炎的標(biāo)準(zhǔn)方法是腎組織活檢和尸體解剖,診斷膽結(jié)石的標(biāo)準(zhǔn)方法是手術(shù)所見(jiàn)。具體作法是運(yùn)用標(biāo)準(zhǔn)診斷方法,在“盲”的條件下將病例區(qū)分為實(shí)際有病和無(wú)病兩組,再將待評(píng)價(jià)的診斷試驗(yàn)與相同病例診斷的結(jié)果作比較,然后列出四格表,就可得出真假陽(yáng)性和真假陰性的結(jié)果,如表33-1所示,并計(jì)算靈敏度、特異度、預(yù)測(cè)值和正確指數(shù)等。
表33-1 診斷試驗(yàn)評(píng)價(jià)指標(biāo)
金標(biāo)準(zhǔn) |
||||
有病(D+) | 無(wú)病(D-) | |||
診斷 | 陽(yáng)性(T+) | 真陽(yáng)性TP | 假陽(yáng)性FP | TP+FP |
陰性(T-) | 假陰性FN | 真陰性TN | FN+TN | |
合計(jì) | TP+FN | FP+TN | TP+FP+FN+TN |
TN(true negative)=真陰性
FP(false positive)=假陽(yáng)性
TP(true positive)=真陽(yáng)性
FN(false negative)=假陰性
如選用標(biāo)準(zhǔn)診斷方法欠妥,則可造成四格表分類(lèi)上的錯(cuò)誤,影響診斷試驗(yàn)的評(píng)價(jià)。例如以外科手術(shù)診斷膽結(jié)石作為標(biāo)準(zhǔn)診斷方法,來(lái)評(píng)價(jià)超聲圖診斷膽結(jié)石的診斷價(jià)值時(shí),可以得出結(jié)論。但若以膽囊造影作為標(biāo)準(zhǔn)方法進(jìn)行比較時(shí),就難以斷定檢出結(jié)果的真?zhèn)。在難以得到標(biāo)準(zhǔn)診斷方法時(shí),醫(yī)師們常將新推出的診斷試驗(yàn)與現(xiàn)有的診斷方法比較。此時(shí)若新試驗(yàn)比較靈敏,檢出的病例就多一些,如以現(xiàn)有方法作為標(biāo)準(zhǔn),則將新試驗(yàn)多檢出的病例錯(cuò)判為假陽(yáng)性。同樣,若新試驗(yàn)更特異,則錯(cuò)判為假陰性的病例將增加。
但獲得一項(xiàng)標(biāo)準(zhǔn)診斷方法并非易事。如以檢查組織貯存鐵是否缺乏作為診斷鐵缺乏的標(biāo)準(zhǔn)診斷方法,這就要作肝穿刺或骨髓活檢,再行鐵染色檢查。這種檢查方法甚至在某些貧血病例也難以做到。因此,不少醫(yī)師將鐵劑治療反應(yīng)作為標(biāo)準(zhǔn)診斷方法。尚有一些病,如糖尿病,其標(biāo)準(zhǔn)診斷方法甚難確定。
為了避免外界環(huán)境因素干擾評(píng)價(jià)工作,要求待評(píng)價(jià)的診斷試驗(yàn)與標(biāo)準(zhǔn)方法在同一時(shí)間和同一化驗(yàn)室內(nèi)進(jìn)行比較。此外,為了減少或避免偏倚,檢驗(yàn)人員在評(píng)價(jià)時(shí)應(yīng)實(shí)施盲法原則,即他們?cè)诓涣私獠±R床表現(xiàn)情況下進(jìn)行比較。
2.被檢查的病例要具備代表性,即要包括各臨床型(輕、中、重型;有或無(wú)并發(fā)癥者)病例。病例的代表性愈好,新的診斷試驗(yàn)的實(shí)用價(jià)值愈大。
3.選擇對(duì)照。對(duì)照應(yīng)在性別、年齡、某些生理狀態(tài)等方面與病例保持均衡。對(duì)照不應(yīng)只包括健康人,還應(yīng)包括確實(shí)未患該病的其他病例以及確實(shí)未患該病但在臨床上極易與該病混淆的其他病病例。
4.確定正常值。正常值的含義應(yīng)說(shuō)清,否則會(huì)直接影響正常值的數(shù)據(jù)。在正態(tài)分布時(shí),正常值可用平均數(shù)±2SD表示。非正態(tài)分布時(shí)可用中位數(shù)或百分位數(shù)表示。繪制患病人群與未患人群診斷試驗(yàn)測(cè)定值的頻數(shù)分布曲線(xiàn)時(shí)常有重疊。區(qū)別正常與異常的界限是否是最佳的臨界點(diǎn),將對(duì)診斷試驗(yàn)的靈敏度和特異度產(chǎn)生明顯的影響。
5.要說(shuō)明病例的來(lái)源。不同來(lái)源的病例對(duì)評(píng)價(jià)一項(xiàng)診斷試驗(yàn)有一定影響。這是由于不同人群某病患病率的差異對(duì)陽(yáng)性預(yù)測(cè)值有影響。同時(shí),對(duì)照的來(lái)源也應(yīng)效待清楚。
。ǘ)診斷試驗(yàn)的評(píng)價(jià)指標(biāo)
1.真實(shí)性(validity)或準(zhǔn)確性(accuracy)要求一項(xiàng)診斷試驗(yàn)具備能正確地鑒別某病例患和未患某病的能力。這種反映患病實(shí)際情況的程度稱(chēng)作真實(shí)性,亦稱(chēng)準(zhǔn)確性。
一項(xiàng)診斷試驗(yàn)與標(biāo)準(zhǔn)診斷方法進(jìn)行比較時(shí)可得出四種結(jié)果(表33-1)。正確結(jié)果,即真病例得出陽(yáng)性結(jié)果(真陽(yáng)性)和非病例得出陰性結(jié)果(真陰性);錯(cuò)誤結(jié)果,即真病例得出陰性結(jié)果(假陰性)和非病例得出陽(yáng)性結(jié)果(假陽(yáng)性)。一項(xiàng)診斷試驗(yàn)得出的正確結(jié)果愈多,該試驗(yàn)的真實(shí)性也愈高。
一項(xiàng)診斷試驗(yàn)的真實(shí)性包括靈敏度(sensitivity)和特異度(specificity)兩方面。前者是指一項(xiàng)診斷試驗(yàn)?zāi)軐?shí)際患病的病例正確地判斷為患某病的能力,后者是指一項(xiàng)診斷試驗(yàn)?zāi)軐?shí)際未患某病的病例正確地判斷為未患某病的能力。
靈敏度即真陽(yáng)性率,為診斷試驗(yàn)陽(yáng)性的患者占患者總數(shù)比例,理想的應(yīng)為100%。特異度即真陰性率,為診斷試驗(yàn)陰性非患者占無(wú)病總?cè)藬?shù)的比例,理想的應(yīng)為100%。
假陰性率為實(shí)際患病,經(jīng)診斷試驗(yàn)判斷為無(wú)病的百分率,即診斷試驗(yàn)判斷為陰性的患者占患者總數(shù)的比例,又稱(chēng)漏診率(統(tǒng)計(jì)學(xué)上稱(chēng)β錯(cuò)誤),理想的應(yīng)是0%。
假陰性率為實(shí)際患病,經(jīng)診斷試驗(yàn)判斷為無(wú)病的百分率,即診斷試驗(yàn)判斷為陰性的非患者占全部無(wú)病者的比例,臨床上稱(chēng)為誤診率(統(tǒng)計(jì)學(xué)上稱(chēng)為α錯(cuò)誤),理想的應(yīng)是0%。
靈敏度與特異度之和,減100%為正確指數(shù),亦稱(chēng)約登指數(shù)(Youdon’s Index),理想的應(yīng)為100%。其值愈大愈好。但應(yīng)注意,正確指數(shù)大時(shí),并未告知是靈敏度高還是特異度高,因此,它不能代替上述四項(xiàng)指標(biāo)。
現(xiàn)以喉拭培養(yǎng)結(jié)果為標(biāo)準(zhǔn)診斷方法,評(píng)價(jià)僅憑臨床觀(guān)察診斷β-溶血性鏈球菌感染的真實(shí)性,結(jié)果見(jiàn)表33-2。
表33-2 以喉拭培養(yǎng)法評(píng)價(jià)臨床診斷的真實(shí)性
喉拭培養(yǎng) |
合計(jì) | |||
陽(yáng)性 | 陰性 | |||
臨床診斷 | 陽(yáng)性 | 27 | 35 | 62 |
陰性 | 10 | 77 | 87 | |
合計(jì) | 37 | 112 | 149 |
靈敏度%=(27/37)×100%=73%
特異度%=(77/112)×100%=69%
假陽(yáng)性率%=1-69/100=31%
假陰性率%=1-73/100=27%
從表33-2還可看出,計(jì)算診斷試驗(yàn)的靈敏度或假陰性率只與患者數(shù)有關(guān),而與非患者數(shù)無(wú)關(guān);計(jì)算診斷試驗(yàn)的特異度或假陽(yáng)性率只與非患者數(shù)有關(guān),而與患者數(shù)無(wú)關(guān)。還要看到靈敏度與假陰性率之和為1。特異度與假陽(yáng)性率之和為1。
在臨床工作中,醫(yī)師希望一項(xiàng)診斷試驗(yàn)的靈敏度和特異度均高。但實(shí)際上很難如愿。事實(shí)是若提高靈敏度必然以降低特異度為代價(jià),反之亦然。這種反比關(guān)系在連續(xù)的計(jì)量資料測(cè)量中容易見(jiàn)到。
現(xiàn)以診斷青光眼為例說(shuō)明上述現(xiàn)象。眼內(nèi)壓升高,視神經(jīng)萎縮和視野的典型缺損是診斷青光眼的三個(gè)重要組成部分。人的眼內(nèi)壓水平在一天內(nèi)有波動(dòng),而在青光眼患者,其波動(dòng)范圍會(huì)更大,因而眼內(nèi)壓水平并非診斷青光眼的一個(gè)可靠指標(biāo)。再者,眼內(nèi)壓水平相同的人,眼內(nèi)病理改變并不一樣。雖然眼內(nèi)壓水平高者患青光眼的可能性低者較大,但需作進(jìn)一步檢查才能作出診斷。
圖33-1 青光眼病人和正常人眼內(nèi)壓分布模式圖
眼內(nèi)壓水平與是否患青光眼的關(guān)系可見(jiàn)圖33-1。甲組為未患青光眼者,眼內(nèi)壓水平波動(dòng)在1.9~3.5kPa(14~26mmHg)之間。乙組為青光眼患者,其眼內(nèi)壓水平在2.9~5.6kPa(22~42mmHg)之間。兩組人眼內(nèi)壓水平在2.9~3.5kPa(22~26mmHg)處有重疊。如欲診斷出全部青光眼患者,即要求試驗(yàn)的靈敏度為100%,則診斷值應(yīng)定為2.9kPa(22mmHg),但相當(dāng)一部分眼內(nèi)壓水平在2.9~3.5kPa(22~26mmHg)之間的未患青光眼的人也將診斷為陽(yáng)性,造成誤診,即特異度差。若將診斷值規(guī)定為3.5kPa(26mmHg),則所有未患青光眼者均為陽(yáng)性,特異度為100%,但眼內(nèi)壓水平在2.9~3.5kPa之間的青光眼患者將診斷為陰性,造成漏診,即靈敏度差。上述事例說(shuō)明一項(xiàng)診斷試驗(yàn)要同時(shí)兼顧高靈敏度和高特異度是困難的。在臨床實(shí)踐中,是將診斷值定在2.9~3.5kPa之間,即在重疊區(qū)的某處。具體確定陽(yáng)性診斷值的作法,一般只能從臨床需要出發(fā),權(quán)衡利弊得失再作出。若所研究的疾病病死率高,預(yù)后不佳,漏診將帶來(lái)嚴(yán)重后果或早期診斷可明顯改善預(yù)后,則診斷試驗(yàn)的陽(yáng)性界限可向左移。這樣,試驗(yàn)的靈敏度高,陰性結(jié)果可排除疾病的存在,但同時(shí)假陽(yáng)性增多。若現(xiàn)有的治療措施不夠理想,可將陽(yáng)性界限右移以降低靈敏度,提高特異度。當(dāng)為假陽(yáng)性者進(jìn)一步檢查所需費(fèi)用太高,為了節(jié)約經(jīng)費(fèi)或假陽(yáng)性可使人心身遭受?chē)?yán)重的痛苦或經(jīng)濟(jì)受到損失時(shí),高特異度尤為必要。
在糖尿病,如以不同的血糖水平作為診斷標(biāo)準(zhǔn)時(shí),同樣可以看到靈敏度和特異度的上述反比關(guān)系,如表33-3所示。隨著血糖水平陽(yáng)性界限的增高,試驗(yàn)的靈敏度下降,特異度升高,反之亦然?磥(lái)將糖尿病診斷試驗(yàn)陽(yáng)性界限或標(biāo)準(zhǔn)規(guī)定在7.15mmol/L(130mg/dl)時(shí)為宜,因此時(shí)靈敏度和特異度均處在80%左右。
表33-3 以不同血糖水平作為糖尿病診斷標(biāo)準(zhǔn)時(shí)的靈敏度和特異度
餐后2小時(shí)的血糖水平 |
靈敏度% |
特異度 | |
Mmol/L | Mg/dl | ||
4.40 | 80 | 100 | 1.2 |
4.95 | 60 | 98.6 | 7.3 |
5.50 | 100 | 97.1 | 25.3 |
6.05 | 110 | 92.9 | 48.4 |
6.60 | 120 | 88.6 | 68.2 |
7.15 | 130 | 85.7 | 82.4 |
7.70 | 140 | 74.3 | 91.2 |
8.25 | 150 | 64.3 | 96.1 |
8.80 | 160 | 55.7 | 98.6 |
9.35 | 170 | 52.9 | 99.6 |
9.90 | 180 | 50.0 | 99.8 |
10.45 | 190 | 44.3 | 99.8 |
11.00 | 200 | 37.1 | 100.0 |
2.可靠性(reliabiliy)、重復(fù)性(repeatability)或精密度(precision)是指一項(xiàng)診斷試驗(yàn)在完全相同的條件下,重復(fù)作時(shí)獲得相同結(jié)果的穩(wěn)定程度。在臨床實(shí)踐中,一般用符合率來(lái)表示可靠性。
影響試驗(yàn)可靠性的因素有:
。1)所使用的儀器、藥品和試劑的變異:儀器,甚至是精密的儀器,如事前未校正,也可造成測(cè)量結(jié)果的系統(tǒng)誤差。藥品的質(zhì)量,試劑配制的方法以及檢驗(yàn)室的環(huán)境因素都可對(duì)試驗(yàn)結(jié)果產(chǎn)生影響。
。2)測(cè)量變異:這與試驗(yàn)操作者的技術(shù)和責(zé)任心有關(guān),因?yàn)槿魏螠y(cè)量都可出現(xiàn)不同程度的測(cè)量變異。若操作者能遵循操作規(guī)程,操作細(xì)心則可減少這種變異。若操作者可在某種程度上自行判斷測(cè)量結(jié)果,則這種變異可以很大甚至難以控制。如用幾種方法(即在不同的檢驗(yàn)室,由不同的操作人員中使用不同的儀器)進(jìn)行測(cè)量,測(cè)量數(shù)值的系統(tǒng)誤差將是難以避免的。
測(cè)量變異尚包括觀(guān)察者間誤差(inter-observer error)和觀(guān)察者自身誤差(intra-observer error)。例如,兩位眼科醫(yī)師同時(shí)分別檢查100例強(qiáng)疑視網(wǎng)膜炎病人,按病情輕重分別登記,結(jié)果兩人判斷的符合率為72%(表33-4)。
表33-4 兩位眼科醫(yī)師獨(dú)立檢查100例視網(wǎng)膜炎病人的結(jié)果比較
A專(zhuān)家判斷病情結(jié)果 | B專(zhuān)家判斷病情結(jié)果 | 合計(jì) | |||
無(wú) | 輕 | 中 | 重 | ||
無(wú) | 24 | 5 | 2 | 0 | 31 |
輕 | 4 | 18 | 2 | 1 | 25 |
中 | 1 | 3 | 18 | 2 | 24 |
重 | 1 | 2 | 5 | 12 | 20 |
合計(jì) | 30 | 28 | 27 | 15 | 100 |
這是觀(guān)察者間誤差。
同一觀(guān)察者對(duì)同一批標(biāo)本前后兩次檢查也有誤差。例如一位細(xì)胞學(xué)專(zhuān)家兩次重復(fù)檢查肺癌細(xì)胞涂片100張,兩次結(jié)果的符合率僅49%(表33-5)。這是觀(guān)察者自身誤差。
表33-5 同一專(zhuān)家重復(fù)兩次檢查100張肺癌細(xì)胞涂片結(jié)果比較
第一次結(jié)果 |
第二次結(jié)果 |
合計(jì) | ||||
不滿(mǎn)意 | 陰性 | 模棱兩可 | 疑似癌細(xì)胞 | 陽(yáng)性 | ||
不滿(mǎn)意 | 2 | 1 | 1 | 0 | 0 | 4 |
陰性 | 7 | 26 | 19 | 1 | 0 | 53 |
模棱兩可 | 4 | 2 | 11 | 5 | 3 | 25 |
疑似癌細(xì)胞 | 0 | 0 | 1 | 6 | 6 | 13 |
陽(yáng)性 | 1 | 0 | 0 | 0 | 4 | 5 |
合計(jì) | 14 | 29 | 32 | 12 | 13 | 100 |
。3)生物學(xué)變異:不同季節(jié)和一日內(nèi)的不同時(shí)間個(gè)體內(nèi)部的生物學(xué)狀態(tài)不斷地發(fā)生變化,也就是產(chǎn)生變異。這樣,在某個(gè)時(shí)點(diǎn)獲得的某生物學(xué)現(xiàn)象的測(cè)量值只能是該時(shí)期內(nèi)多次測(cè)量所獲得的數(shù)值一個(gè)樣本,并不能代表各次測(cè)量的真實(shí)數(shù)值。臨床上各項(xiàng)檢驗(yàn)工作多是在某一時(shí)點(diǎn)進(jìn)行的,并將各種檢驗(yàn)結(jié)果用于指導(dǎo)臨床實(shí)踐。所以臨床醫(yī)師應(yīng)對(duì)個(gè)體的生物學(xué)變異給予足夠的重視。
此外,不同個(gè)體的生物學(xué)狀態(tài)不同,這也將影響某生物學(xué)現(xiàn)象的測(cè)量值,使之產(chǎn)生變異。
實(shí)際上,臨床上獲得的測(cè)量值是上述幾種影響試驗(yàn)可靠性的因素的累加值,如圖33-2所示。它說(shuō)明不同來(lái)源的變異對(duì)血壓測(cè)量值的影響以及這些變異來(lái)源的累加作用。還可以看出不同觀(guān)察者間的測(cè)量值雖有差異,甚至可以相差1.5kPa(12mmHg),但可以說(shuō)由測(cè)量所致的變異相對(duì)較小,而同一個(gè)體在一天內(nèi)不同時(shí)間的血壓測(cè)量值的變異卻很大。這說(shuō)明一次血壓測(cè)量值并不能代表該病例的通常血壓。最下面的那條血壓測(cè)量值曲線(xiàn)是許多病例、多個(gè)觀(guān)察者一天中多次測(cè)量的結(jié)果,它突出地說(shuō)明上述各種影響可靠性因素的累加作用。
圖33-2 變異的來(lái)源:血壓的測(cè)量
資料來(lái)源:周崐,臨床實(shí)用流行病學(xué),第一版,黑龍江人民出版社,哈爾濱,1989
3.真實(shí)性和可靠性之間的關(guān)系兩者不一定彼此相關(guān)。如圖33-3所示,有的診斷試驗(yàn)真實(shí)又可靠(A),有的真實(shí)但不很可靠(B),因?yàn)樗母鞔螠y(cè)量值圍繞真實(shí)值散在分布,而且范圍較廣;另一些試驗(yàn)可難可靠但不很真實(shí)(C),其測(cè)量結(jié)果雖穩(wěn)定,但系統(tǒng)地偏離真實(shí)值;有的試驗(yàn)既不真實(shí)又不可靠(D)。一項(xiàng)診斷的實(shí)用價(jià)值決定于其真實(shí)性,而真實(shí)性又受到可靠性的制約。
4.預(yù)測(cè)值(predictive value)靈敏度和特異度是一項(xiàng)診斷試驗(yàn)的特征,在決定是否采用某項(xiàng)試驗(yàn)時(shí)醫(yī)師應(yīng)考慮這些特征。一旦采用了某項(xiàng)診斷試驗(yàn),醫(yī)師就要仔細(xì)考慮試驗(yàn)結(jié)果的意義。如獲陽(yáng)性結(jié)果,患某病的可能性是多少;若獲陰性結(jié)果,未患某病的可能性是怎樣?這就是預(yù)測(cè)值。陽(yáng)性預(yù)測(cè)值是指試驗(yàn)陽(yáng)性的病例中真陽(yáng)性的比例;陰性預(yù)測(cè)值是指試驗(yàn)陰性的病例中真陰性的比例。按表33-1,預(yù)測(cè)值的計(jì)算方法如下:
圖33-3真實(shí)性與可靠性關(guān)系示意圖
根據(jù)表33-1提供的數(shù)據(jù),臨床上診斷為溶血性鏈球菌咽炎的病例中,陽(yáng)性預(yù)測(cè)值為44%,陰性預(yù)測(cè)值為88%。
習(xí)慣上以+PV(或PV+)表示陽(yáng)性預(yù)測(cè)值,以-PV(或PV-)表示陰性觀(guān)測(cè)值。一般說(shuō)來(lái),試驗(yàn)的靈敏度愈高,陰性預(yù)測(cè)值就愈高;特異度高的試驗(yàn),陽(yáng)性預(yù)測(cè)值就越好。但診斷試驗(yàn)的靈敏度和特異度并不能完全決定試驗(yàn)的陽(yáng)性預(yù)測(cè)值,在很大程度上與人群某病的患病率有關(guān)。不同人群某病患病率可相差甚大,臨床醫(yī)師對(duì)此已有共識(shí)。例如酸性磷酸酶可用于診斷前列腺癌,其靈敏度為70%,特異度為90%。若將之用于不同人群,所獲不同人群陽(yáng)性預(yù)測(cè)值差別甚大,如表33-6所示。如在一般人群中用此法作前列腺癌篩檢,結(jié)果出現(xiàn)大量假陽(yáng)性者,檢查結(jié)果很不令人滿(mǎn)意。如將此法在高危人群(男性,75歲以上)中作篩檢,陽(yáng)性預(yù)測(cè)值為5.6%,即平均每18名陽(yáng)性者中只1名證實(shí)患前列腺癌。若將本項(xiàng)診斷試驗(yàn)用來(lái)診斷可觸及前列腺結(jié)節(jié)病例時(shí),陽(yáng)性預(yù)測(cè)值為93%,即93%陽(yáng)性患者患前列腺癌。
表33-6 患病率與預(yù)測(cè)值的關(guān)系
患病率(1/10萬(wàn)) | 陽(yáng)性預(yù)測(cè)值 | |
一般人群 | 35 | 0.4 |
男性,75歲以上 | 500 | 5.6 |
臨床觸及前列腺結(jié)節(jié) | 50000 | 93.0 |
資料來(lái)源:孫中行,臨床流行病學(xué)287頁(yè),1989
三、提高診斷試驗(yàn)效率的方法
人們都在努力尋求既靈敏又特異的診斷試驗(yàn),但在臨床實(shí)踐中這種理想的方法并不多,可以采用下述兩種方法來(lái)提高診斷試驗(yàn)的效率!
(一)選擇患病率高的人群(高危人群)
綜上所述,一項(xiàng)診斷試驗(yàn)的靈敏度與特異度是相對(duì)固定的,而人群患病率水平對(duì)一項(xiàng)診斷試驗(yàn)陽(yáng)性預(yù)測(cè)值的影響卻很大。這樣,結(jié)論是很清楚的,就是將一項(xiàng)診斷試驗(yàn)用于患病率低的人群,則陽(yáng)性預(yù)測(cè)值較低,但若將其用于高危人群,則可明顯提高陽(yáng)性預(yù)測(cè)值,F(xiàn)舉例說(shuō)明怎樣選擇患病率不同的人群來(lái)提高運(yùn)動(dòng)心電圖試驗(yàn)的效率。已知運(yùn)動(dòng)心電圖試驗(yàn)的靈敏度和特異度分別為80%和74%。接受運(yùn)動(dòng)心電圖檢查的人群共有三種情況,即病例甲是老年人,具有典型心絞痛癥狀,病例乙是胸痛待查的中年人,病例丙是因情緒變化而產(chǎn)生胸痛癥狀的青年人,如表33-7所示,病例甲患心絞痛的可能性為90%,通過(guò)心電圖運(yùn)動(dòng)試驗(yàn)估計(jì)其陽(yáng)性預(yù)測(cè)值為97%,即增加了7%;病例丙患心絞痛的可能性為10%,根據(jù)同樣的方法,估計(jì)其陽(yáng)性預(yù)測(cè)值為25%,即增加了15%;病例乙患心絞痛的可能性為50%,根據(jù)同法,估計(jì)其陽(yáng)性預(yù)測(cè)值為75%,即增加了25%。由此可見(jiàn),若在估計(jì)冠心病患病率為40%~60%的人群中用心電圖運(yùn)動(dòng)試驗(yàn)來(lái)作冠心病診斷時(shí),診斷的效率提高,即此時(shí)陽(yáng)性和陰性預(yù)測(cè)值均明顯增加。
表33-7 不同的估計(jì)患病率,心電圖運(yùn)動(dòng)試驗(yàn)的預(yù)測(cè)值
估計(jì)患病率(%) |
試驗(yàn)陽(yáng)性 |
試驗(yàn)陰性 | ||
預(yù)測(cè)值(%) | 增加數(shù)(%) | 預(yù)測(cè)值(%) | 增加數(shù)(%) | |
90 | 97 | 7 | 29 | 19 |
80 | 92 | 12 | 48 | 28 |
70 | 88 | 18 | 61 | 31 |
60 | 82 | 22 | 71 | 31 |
50 | 75 | 25 | 79 | 29 |
40 | 67 | 27 | 85 | 25 |
30 | 57 | 27 | 90 | 20 |
20 | 43 | 21 | 94 | 14 |
10 | 25 | 15 | 97 | 7 |
資料來(lái)源:孫中行,臨床流行病學(xué),301頁(yè),1989
(二)采用聯(lián)合試驗(yàn)的方法
現(xiàn)已證明,采用聯(lián)合試驗(yàn)的方法可提高診斷試驗(yàn)的效率。聯(lián)合試驗(yàn)的方法有兩種,即并聯(lián)和串聯(lián)。
1.并聯(lián)試驗(yàn)(parallel test)又稱(chēng)平行試驗(yàn)。這種方法的作法是同時(shí)作幾項(xiàng)診斷試驗(yàn),只要其中一項(xiàng)為陽(yáng)性就可診斷患某病。與單項(xiàng)診斷試驗(yàn)比較,并聯(lián)試驗(yàn)可提高靈敏度和陰性預(yù)測(cè)值,卻使特異度和陽(yáng)性預(yù)測(cè)值下降,即并聯(lián)試驗(yàn)使漏診率下降,卻增加了假陽(yáng)性率。若臨床醫(yī)師需要一項(xiàng)靈敏度高的診斷試驗(yàn),而此時(shí)只有兩項(xiàng)或多項(xiàng)不十分靈敏的診斷方法,并聯(lián)試驗(yàn)是他首選的方法。例如,已知靜脈造影術(shù)是診斷下肢深靜脈栓塞的標(biāo)準(zhǔn)診斷方法,但這種方法既昂貴,又不安全。尚有兩種方法即陰抗體積描記圖和注射125I纖維蛋白原作下肢掃描也可用于該病的診斷。如使用單項(xiàng)試驗(yàn),靈敏度和特異度各為74%。若并聯(lián)使用上述兩項(xiàng)試驗(yàn),其靈敏度和特異度可分別達(dá)到94%和91%,見(jiàn)表33-8。由此可見(jiàn),并聯(lián)使用上述兩項(xiàng)診斷試驗(yàn)是診斷下肢靜脈栓塞的安全和節(jié)約的方法,并可提供準(zhǔn)確的資料,因而可取代靜脈造影術(shù)。
表33-8 阻抗體積描記圖和注射125I纖維蛋白原掃描兩法
平行試驗(yàn)與靜脈造影術(shù)的比較
靜脈造影術(shù)(參照試驗(yàn))的結(jié)果 | ||||
陽(yáng)性 | 陰性 | 合計(jì) | ||
阻抗體積描記圖和125I纖維蛋白原掃描 | 兩者之一或兩者均陽(yáng)性 | 81 | 10 | 91 |
兩者均陰性 | 5 | 104 | 109 | |
合計(jì) | 86 | 114 | 200 |
靈敏度=81/86×100=94%
特異度=104/114×100=91%
資料來(lái)源:孫中行,臨床流行病學(xué),302頁(yè),1989
2.串聯(lián)試驗(yàn)(serial test)也稱(chēng)系列試驗(yàn)。這種方法是依次順序地作幾項(xiàng)試驗(yàn),但只有全部試驗(yàn)皆呈現(xiàn)陽(yáng)性時(shí)才能作出診斷。具體的作法如表33-9所示。由于需要取得前一項(xiàng)診斷的結(jié)果才能作另一項(xiàng)試驗(yàn),因而串聯(lián)試驗(yàn)要用去一段時(shí)間。臨床上是先作較簡(jiǎn)單、安全的試驗(yàn),當(dāng)出現(xiàn)陽(yáng)性結(jié)果時(shí),再作比較復(fù)雜或有一定危險(xiǎn)的試驗(yàn)。
表33-9 聯(lián)合試驗(yàn)的判斷方法
聯(lián)合試驗(yàn)方式 |
結(jié)果 |
判斷結(jié)果 | |
試驗(yàn)1 | 試驗(yàn)2 | ||
平行試驗(yàn) | + | + | + |
+ | - | + | |
- | + | + | |
- | - | - | |
系列試驗(yàn) | + | + | + |
+ | - | - | |
- | 不必作 | - |
資料來(lái)源:孫中行,臨床流行病學(xué),302頁(yè),1989
表33-10 串聯(lián)試驗(yàn):診斷心肌梗塞的血清酶試驗(yàn)
酶試驗(yàn) | 靈敏度(%) | 特異度(%) |
CPK | 96 | 67 |
SGOT | 91 | 74 |
LDH | 87 | 91 |
CPK、SGOT、LDH | 78 | 95 |
資料來(lái)源:孫中行,臨床流行病學(xué),303頁(yè),1989
串聯(lián)試驗(yàn)可提高診斷試驗(yàn)的特異度和陽(yáng)性預(yù)測(cè)值,即出現(xiàn)陽(yáng)性結(jié)果時(shí)患該病的可能性就更大,即降低了誤診率,卻增加了漏診率。當(dāng)幾項(xiàng)診斷試驗(yàn)特異度均不高時(shí),采用串聯(lián)試驗(yàn)最為適宜。例如,診斷心肌梗塞的三種試驗(yàn)中沒(méi)有一項(xiàng)是特異的,見(jiàn)表33-10。若單獨(dú)使用其中任何一項(xiàng)試驗(yàn)則漏診不少患者。如采用串聯(lián)試驗(yàn)方法則提高了心肌梗塞診斷的特異度,降低了誤診率。