統(tǒng)計學問題出現在醫(yī)學論文中需要注意哪些問題?
1. 設計方面的問題
1.1 分組沒有嚴格遵循隨機化原則研究對象的分組與抽樣離不開隨機化原則,在足夠樣本的前提下,隨機抽樣,隨機分組,明確交代隨機方法,各組樣本量、基本特征等。隨機不等于隨便,有的作者濫用隨機,只要抽樣或分組,一概冠以隨機,不描述隨機方法,把隨意、隨便當做隨機,使研究結果不可信。
1.2 無對照組或不合理醫(yī)務科技工作者開展研究的目的就是驗證假設是否正確,沒有對照,無法做出判斷。有的論文無對照組,沒有對比觀察,所得結論沒有說服力。有的論文雖設有對照組,但不是嚴格的隨機分組,組間缺乏可比性,如非同期對照,組間性別、年齡、患病狀況不一致等。在實驗組和對照組的可比性方面,兩組例數要基本一致,否則沒有可比性。
1.3 樣本含量過少抽取恰當的樣本量,結果才有可靠性。有些文章例數太少,這樣抽樣誤差大,導致結果不可靠。研究對象變量標準差小的,樣本可以小一些。觀察計數指標的樣本一般不少于20——30例,計量指標的樣本不少于5——10例。有的作者僅僅觀察了數例患者,就得出百分之多少的有效率,顯然是不恰當的。
對于對比分析,樣本太少得出的結果不可靠,往往隨著樣本量的增大而發(fā)生變化。
2. 統(tǒng)計學處理不恰當。
在進行統(tǒng)計學處理時,首先要明白研究資料是計數資料還是計量資料,盡管是一個常識性的問題,但仍有不少作者搞混了。先分類再計數的資料叫計數資料,如A組30例,B組32例,可根據研究目的計算出陽性率、治愈率等。測定某項具體數值的資料叫計量資料,如身高、體重、脈搏、血壓等許多物理診斷和化驗結果。在醫(yī)學科研論文中,計數資料最常用的統(tǒng)計學方法是檢驗,計量資料最常用的是t檢驗。在研究設計時,就應根據研究資料的特點,決定假設檢驗的方法。在處理資料時,因均數和標準差是用來描述正態(tài)分布資料集中和離散趨勢的指標,可否采用均數±標準差描述研究資料的分布特征,首先要看資料是否是正態(tài)分布,如果資料不是正態(tài)分布或者方差不齊時,應對資料進行轉換處理,使其符合正態(tài)分布,方差齊性后采用t檢驗或方差分析,達不到上述要求,用秩和檢驗。來稿中,不少作者不考慮適用條件,盲目使用t檢驗。造成統(tǒng)計學方法使用不當,結果不可靠。更有甚者,有的作者不分計數資料還是計量資料,亂用 檢驗或t檢驗,其結果可想而知。這是無統(tǒng)計學常識或極不負責任的表現。
有的研究資料數據龐大,只能在表格描述中用阿.拉伯數字或特殊符號表示與比較對象的P值,如P>0.05,P<0.05,P<0.01,無法一一給出具體的P值。但有的作者既不交代使用的統(tǒng)計學方法,也不給出具體的P值,直接列出P<0.05或P>0.05,認為差異有統(tǒng)計學意義或無統(tǒng)計學意義,使讀者對無法判斷結果的可靠性。正確的做法是寫明使用的統(tǒng)計學方法,使用了什么統(tǒng)計學軟.件,如進行了校正檢驗。亦應說明。這才有說服力。
3. 描述不嚴謹。
日常生活中對差異的判斷與統(tǒng)計學上差異是否有統(tǒng)計學意義是兩個完全不同的概念。我們主觀上感覺差異不大,而經統(tǒng)計學處理差異可能具有統(tǒng)計學意義;主觀上感覺差別很大,但經統(tǒng)計學處理差異可能有統(tǒng)計學意義。有相當數量的作者,在描述統(tǒng)計學結果時,常用差異顯著或差異非常顯著,易與日常生活中差異的概念混淆,使用差異有統(tǒng)計學意義或差異無統(tǒng)計學意義更為確切。
我們把檢驗水準設定為a=0.05時就是以P>0.05為界值,一般以P>0.05,P<0.05,P<0.O1 3個檔次描述差異有無統(tǒng)計學意義即可,有的作者出現P<0.001,以強調差異的顯著性。有的作者用P>O.01或P<0.1來表示,是錯誤的,P>0.O1既可能是P>0.05,也可能是P<0.05,二者有本質的不同。
4. 統(tǒng)計符號使用不規(guī)范!
統(tǒng)計符號使用不規(guī)范是論文中經常出現的問題,把卡方檢驗中的 寫成x或x2,丟掉平方或把希臘字母x寫成英文字母x;把均數±標準差( ±s),丟掉z 上方的一橫,既影響論文質量,又影響閱讀效果。
5. 統(tǒng)計表格不規(guī)范。統(tǒng)計表格是論文的重要組成部分,表格是否符合統(tǒng)計學要求,對論文有重要影響。常見的問題有:
①無表題;②表題過于簡單或過于繁瑣。不確切;③橫縱標目倒置,不符合語法規(guī)律;④ 標目層次過多;⑤線條太多。甚至左上角有斜線;⑥ 表內同一欄目數字不對齊,小數點后位數不一致。表題如同文章的題目,簡明扼要,字數控制在15個字以內。表格左側的標目叫橫標目,相當于漢語的主語,表明相應橫行內數字的涵義;縱標目位于表格的上方,相當于漢語的謂語部分,說明表格內相應縱行數字的涵義。
主謂語倒置是統(tǒng)計表格最常見的錯誤,一般情況下主語做橫標目,謂語做縱標目。統(tǒng)計表用三線表,即頂線、底線和隔開縱標目與表內數字的橫線,必要時可在縱標目下加輔助線,其余線條一概省略。
統(tǒng)計表格和文字敘述相輔相成,互相補充,能用簡潔的文字說明的,一般不用表格,文字描述不要和表格內容完全重復。表格要簡潔明快,重點突出,讓人一目了然,不要變成數字的堆徹。出現統(tǒng)計表前,要用簡要文字描述或強調主要發(fā)現,不要把文字敘述放在表格后。
6 使用統(tǒng)計指標不當。常見的問題是率與構成比、發(fā)病率與患病率、死亡率與病死率等的混淆。
6.1 把構成比當率構成比是說明事物或現象內部各構成部分的比重,構成比表示某事物內部各組成部分的比重或分布,單位為%,各組成部分之和應為100%。計算公式為:構成比=某組成部分的觀察單位數/同一事物各組成的觀察單位總數例如2011年某市圍產兒死亡總數為18例,其中死胎7例、死產3例、新生兒死亡8例。其構成比分另0為38.89%、16.67%、44.44%。
率為表示某種現象發(fā)生的頻率或強度。常以%、/萬或/lo萬表示。計算公式為率=某時期內某現象實際觀察單位數/同時期內可能發(fā)生該現象的觀察單位總數,如共檢測568名5——7歲兒童,患齲齒兒童314人,檢出率55.28%。
構成比和率都是相對數指標。有一篇題為某年某地區(qū)4種乙類傳染病疫情分析。經數據處理后,作者認為,4種傳染病的發(fā)病率依次為痢疾54.53%(1546/2 835)、肝炎16.19%(459/2 835)、乙腦9.21%(261/2 835)、流腦6.89% (569/283520.07)。該資料是構成比,不是發(fā)病率。作者犯了以比代率的錯誤。
6.2 發(fā)病率與患病率發(fā)病率是指觀察期內(年、季、月等)新發(fā)生某病的例數與同期平均人口數之比,強調在觀察期內的新發(fā)病例數,常以‰ 、/7/或/lO萬表示。其計算公式為:某病發(fā)病率等于某年(期)內所發(fā)生的新病例數除以同年(期)平均人口數乘1000%o。例如某地某年年平均人口數為2500人,白喉發(fā)病28人,該地白喉年發(fā)病率為11.20%0。而患病率則指觀察時點的某病的現患病例數與該時點人口數之比.強調的是該觀察時點上某病的現患(新、舊病例)情況,常以百分率表示。有人調查16 875人,其中男性8 674人,沙眼患者7 632人,發(fā)病率為87.99%;女性8 201人,沙眼患者6 210人。發(fā)病率為75.72%。這樣的結論當然是錯誤的,其所描述的結果應該是患病率。
6.3 死亡率與病死率這也是兩個容易混淆的指標。某病死亡率是觀察人群中某病的死亡頻率。常以‰、/萬或/10萬表示;某病病死率是某病患者中因該病而死亡的頻率。
一般以百分率表示。前者反映人群因該病而死亡的頻率,后者反映疾病的預后。部分作者常將某病住院病死率誤為某病死亡率。如重癥監(jiān)護室患者死亡情況分析一文中報道,顱腦損傷32例,死亡20例,死亡率為62.5%;嚴重心衰26例,死亡9例,死亡率為34.6%;嚴重腎衰竭18例,死亡11例,死亡率為61.1%。很明顯,作者在這里是將住院病死率誤作死亡率來討論。
我們在編輯醫(yī)學論文中經常會發(fā)現存在這樣那樣的統(tǒng)計學問題,致使文章質量下降,甚至無法刊用,十分可惜。提高統(tǒng)計學應用水平,減少統(tǒng)計學差錯,是作者、審稿專家和編輯共同的責任。樹立嚴謹的科學態(tài)度,選擇正確的統(tǒng)計學方法,對提高科研水平,確保論文質量有著十分重要的意義。
聯系方式詳見:醫(yī)學全在線論文投稿聯系方式
更多醫(yī)學職稱論文發(fā)表及評審條件相關信息推薦:
醫(yī)學全在線-論文頻道(m.f1411.cn/lunwen/)第一時間整理發(fā)布全國各地醫(yī)學職稱評審公告、評審結果、論文評審條件、期刊目錄等通知。