微生物基因組學(xué)(Genomics)是利用全基因組DNA序列研究微生物基因及其功能的學(xué)科。近年來(lái),由于DNA測(cè)序自動(dòng)化與信息技術(shù)的飛躍發(fā)展,用1~2年時(shí)間就可完成一種微生物的全基因組序列測(cè)定。自1995年美國(guó)首次將第一個(gè)原核細(xì)菌—流感嗜血桿菌的全基因組序列公布以來(lái),目前至少已有32種病原菌的全基因組測(cè)序已告完成,另有超過(guò)20多種病原菌的全基因組測(cè)序正在進(jìn)行,數(shù)以萬(wàn)計(jì)的病原菌基因?qū)⒈昏b定出來(lái)。
細(xì)菌是一大群原核細(xì)胞型微生物,其基因組比真核生物的基因組要小得多,僅為人類基因組(31.647億堿基對(duì))的百分之一到千分之一,而且沒(méi)有內(nèi)含子結(jié)構(gòu),是試驗(yàn)基因測(cè)序及分析方法的理想系統(tǒng)。多年來(lái),科學(xué)家對(duì)細(xì)菌的生理學(xué)、細(xì)胞學(xué)、分子生物學(xué)和致病性研究所獲得的大量知識(shí),使細(xì)菌成為研究和分析基因組序列與相關(guān)生物學(xué)功能關(guān)系的理想模式。細(xì)菌基因組研究的關(guān)鍵方法與策略,對(duì)完成多細(xì)胞真核生物,如美麗線蟲(Caenorhabditiselegans)、果蠅、小鼠、基準(zhǔn)野草(Arabidopsis thalians)乃至人類全基因組的草圖具有重要指導(dǎo)意義。
絕大多數(shù)細(xì)菌的基因組是單一閉合環(huán)狀的雙鏈DNA分子,大多數(shù)細(xì)菌基因組的大小介于0.6~4.7Mb,最大的大腸埃希菌含有4.64Mb。最近研究發(fā)現(xiàn),霍亂弧菌的基因組由兩個(gè)環(huán)狀染色體組成,大小分別為2.96Mb與1.07Mb。原核細(xì)胞型微生物基因組的大小與其代謝及形態(tài)學(xué)的復(fù)雜程度成比例。支原體、疏螺旋體、密螺旋體和立克次體的基因組大小均小于1.5Mb,如生殖器支原體染色體為0.58Mb。它們有些是專性細(xì)胞內(nèi)寄生的微生物,另一些則要求苛刻的培養(yǎng)條件才能生長(zhǎng)。在同種或同屬的細(xì)菌中,它們的基因組大小的差別不大。
細(xì)菌基因組的排列特征是:一些基因可在染色體上單獨(dú)存在,轉(zhuǎn)錄為一種mRNA,翻譯為一種蛋白質(zhì);而大多數(shù)情況下,編碼相關(guān)功能的一小串基因位于一個(gè)操縱子上,自一個(gè)啟動(dòng)子開(kāi)始,轉(zhuǎn)錄成多基因的mRNA分子,翻譯成多種功能相關(guān)的蛋白質(zhì)。細(xì)菌蛋白質(zhì)的分子量平均為45kDa,因此可推算出編碼蛋白質(zhì)的基因的平均長(zhǎng)度為1.1kb。細(xì)菌染色體序列分析表明,大腸埃希菌有4288個(gè)基因,其中1/3基因的功能不清楚;蛑g的距離大約為118bp,距離大于600bp的基因很可能含有獨(dú)立的調(diào)節(jié)序列。細(xì)菌基因組分析真實(shí)反映了細(xì)菌染色體編碼的產(chǎn)物。在大腸埃希菌中鑒定的蛋白質(zhì)為細(xì)菌的動(dòng)力、趨向性、物質(zhì)轉(zhuǎn)運(yùn)、生物合成、生物氧化等多種生命活動(dòng)所必需。
病毒基因組的化學(xué)成分為DNA或RNA,籍此分為DNA病毒和RNA病毒兩大類。病毒核酸與細(xì)菌核酸不同,可呈線型或環(huán)型,分為雙鏈RNA、單鏈RNA、分節(jié)段RNA、單鏈DNA或雙鏈DNA。病毒核酸的大小差別懸殊,例如,人類細(xì)小病毒僅由5kb組成,而最大的痘類病毒則含有4Mb。病毒基因的轉(zhuǎn)錄與轉(zhuǎn)譯均需在細(xì)胞內(nèi)進(jìn)行,因此,病毒基因組的組成與真核細(xì)胞的基因組相似,而不同于細(xì)菌等原核細(xì)胞的基因組。例如,細(xì)菌基因組無(wú)內(nèi)含子,而病毒基因組中有內(nèi)含子,需通過(guò)轉(zhuǎn)錄后剪接和加工;病毒核酸存在基因重疊現(xiàn)象。
病毒的核酸是決定病毒的感染性、復(fù)制特性和遺傳性的基礎(chǔ)。隨著病毒基因克隆、序列分析及基因表達(dá)等技術(shù)的應(yīng)用,目前幾乎對(duì)所有病毒科的代表病毒進(jìn)行了基因克隆與核苷酸測(cè)序。病毒基因的序列對(duì)于了解可能編碼的病毒蛋白的數(shù)量和性質(zhì)、病毒基因復(fù)制和表達(dá)的調(diào)控機(jī)制具有重要意義。
由于大多數(shù)細(xì)菌的基因組大小一般在0.6~4.7Mb之間,快速核苷酸序列測(cè)序的策略需借助于經(jīng)典的鳥(niǎo)槍法(shot gun)建立基因文庫(kù),然后進(jìn)行隨機(jī)克隆測(cè)序。這種方法首先用于流感嗜血桿菌全基因組序列測(cè)定,目前幾乎成為微生物全基因組序列測(cè)定的標(biāo)準(zhǔn)方法。其基本步驟為:先將細(xì)菌染色體DNA機(jī)械性隨機(jī)切割成一定大小的DNA片段,分別插入質(zhì)粒載體以構(gòu)建二套DNA文庫(kù),即:
(1)小片段文庫(kù):選擇平均約為2kb的切割產(chǎn)物,將末端補(bǔ)平,克隆到經(jīng)Smal處理過(guò)的克隆載體(如pUC18/pUC19、pBluescript系列)上。選擇這種分子量范圍的小片段,其目的是盡量減少單個(gè)插入片段中存在完整基因的可能性。因?yàn)槟承┗虮磉_(dá)毒性產(chǎn)物可導(dǎo)致宿主菌死亡,使該片段丟失,導(dǎo)致測(cè)序過(guò)程中缺口總數(shù)增多。
(2)大片段文庫(kù):包含15~20kb的隨機(jī)切割產(chǎn)物,克隆到λ噬菌體載體中。
此外,還可以用多種限制性內(nèi)切酶分別消化細(xì)菌染色體DNA,回收一定大小的DNA片段,將這些片段克隆到相應(yīng)的限制性內(nèi)切酶消化過(guò)的測(cè)序載體中。這樣就可以獲得多種內(nèi)切酶的不完全文庫(kù)。文庫(kù)構(gòu)建完后,可進(jìn)行大規(guī)模的測(cè)序。
每個(gè)從DNA測(cè)序儀上讀取的原始序列,首先經(jīng)過(guò)一個(gè)簡(jiǎn)單的程序,將兩端載體序列切除,然后集中到一個(gè)數(shù)據(jù)庫(kù)中。目前用于組裝全基因組的計(jì)算機(jī)程序主要是美國(guó)基因組研究所所編制的TIGRASSEMBLER軟件。高質(zhì)量的序列片段和每條序列片段的長(zhǎng)度為400bp是該軟件成功拼接的保證。但組裝后的序列片段之間仍有缺口存在,需用DNA印跡法、蛋白質(zhì)連接法、大片段文庫(kù)法和長(zhǎng)距PCR等方法才能將所有缺口補(bǔ)平。
DNA序列拼接工作完成后,經(jīng)過(guò)計(jì)算機(jī)分析,完成全基因組各個(gè)區(qū)域的編號(hào)和注釋,最后存入數(shù)據(jù)庫(kù),并在互聯(lián)網(wǎng)上發(fā)表以供全世界的科學(xué)家參考和使用。
截止2001年底,已完成55種微生物的基因組測(cè)序工作,其中包括29種病原菌(表1-1),有130余種微生物的基因組序列正在測(cè)定中。在多個(gè)互聯(lián)網(wǎng)中(如www.tigr。org/tdb/mdb/mdbinprogress.html)中,可以查閱到有關(guān)微生物全基因組序列測(cè)定完成的最新資料。
表1-1 已完成基因組測(cè)序的致病菌及其所致疾病
病原菌株 | 所致主要疾病 |
流感嗜血桿菌(H.influenzae)Rd 幽門螺桿菌(H.pylori)26695和J99 大腸埃希菌 K12(E.coli K12)MG1655 大腸埃希菌O157:H7 結(jié)核分枝桿菌(M.tuberculosis)H37Rv 麻風(fēng)分枝桿菌(M.laprae) 胎兒彎曲菌(C.fetus)NCTC11169 產(chǎn)單核細(xì)胞李氏菌(L.monocytogens)EGD-2-e 腦膜炎奈瑟菌(M.meningitides)A型Z2491和B型MC58 淋病奈瑟菌(N.gonorrhoeae)FA1090 化膿性鏈球菌(S.hemolyticus) 福氏志賀菌(S.flexneri)2a * 表皮葡萄球菌(S.epidermidis) * 銅綠假單胞菌(P.aeruginosa)PA01 霍亂弧菌(V.cholerae)N1696 肺炎鏈球菌(S.pneumoniae) 產(chǎn)氣莢膜梭菌(C.perfringens) 空腸彎曲菌(C.jejuni) 鼠疫耶氏菌(Y.petis)C092 杜氏嗜血桿菌(H.ducreyi) 百日咳鮑特菌(B.pertussis) 傷寒沙門菌(S.typhi) 腸炎沙門菌(S.enteritidis) 白喉棒狀桿菌(C.diphtheriae) 伯氏疏螺旋體(B.burgdorferi)B31 梅毒螺旋體(T.pallidum)Nicholas 鉤端螺旋體(L.interrogans) * 普氏立克次體(P.prowazekii)MadridE 康氏立克次體(R.conarii)Malish7 肺炎衣原體(C.pneumoniae)CWL029和AR39 沙眼衣原體(C.trachomatis)D/UW-3/Ck和Mopn 生殖器支原體(M.genitalium)G-37 肺炎支原體(M.pneumoniae)M129 溶脲脲原體(U.urealyticum) | 腦膜炎、中耳炎 胃炎、消化性潰瘍 腸道感染、泌尿系統(tǒng)感染 出血性結(jié)腸炎、溶血性尿毒綜合征 結(jié)核病 麻風(fēng) 胃腸炎 李斯特菌病、流產(chǎn) 腦膜炎 淋病 化膿性感染,敗血癥 泌尿系統(tǒng)感染、細(xì)菌性心內(nèi)膜炎、敗血癥 局部化膿性感染等 霍亂 肺炎、菌血癥、腦膜炎 氣性壞疽、食物中毒 鼠疫 百日咳 腸熱癥 腸炎 白喉 梅毒 鉤體病 鈕扣熱 急性呼吸道感染、動(dòng)脈硬化癥 沙眼 呼吸道疾病 |
*:為我國(guó)科學(xué)家完成的測(cè)序項(xiàng)目
細(xì)菌全基因組序列測(cè)定完成后,更重要的任務(wù)是鑒定基因及盡可能確定基因的功能,稱之為后基因組學(xué)。通常采用開(kāi)放讀碼框(ORF)推定、密碼子使用和同源性比較等技術(shù)鑒定基因。應(yīng)用新近出現(xiàn)的軟件BLOCK、PROSITE、BEAUTY、MOTIFFINDER等,將基因組中的功能性序列序區(qū)鑒定出來(lái)。主要分析內(nèi)容包括:①發(fā)現(xiàn)開(kāi)放讀碼框和排除重復(fù)序列;②查詢基因和蛋白數(shù)據(jù)庫(kù);③檢查用碼傾向;④檢查功能位點(diǎn)。
病原菌全基因組測(cè)序的重要用途是:研究和鑒定有關(guān)的毒力基因,尋找抗菌藥物作用的靶位以及編碼保護(hù)性抗原的基因。例如,采用BLAST軟件,將預(yù)期的編碼序列與GenBank數(shù)據(jù)庫(kù)中已知基因的序列作比較,在蒼白螺旋體1041個(gè)基因中搜查出可能是毒力因子的有70個(gè),而其中只有半數(shù)認(rèn)定與毒力相關(guān)。采用PHD軟件可以預(yù)示細(xì)菌基因組中的跨膜蛋白序列,用SIGNALP軟件可將一些基因的信號(hào)序執(zhí)業(yè)獸醫(yī)列識(shí)別出來(lái)。此外,應(yīng)用基因敲除法(knock-out)、條碼標(biāo)記誘變(signature-taggedmutagenesis)技術(shù),以及遺傳性足跡試驗(yàn)等方法,亦可發(fā)現(xiàn)一系列與細(xì)菌致病作用有關(guān)的基因。
將種屬密切相關(guān)的細(xì)菌全基因組序列進(jìn)行比較,可以獲知細(xì)菌基本代謝的保守基因和特異性基因。利用高密度寡核苷酸微陣列(high density oligonucleotide arrays)雜交技術(shù),即DNA芯片(DNA chip)技術(shù),可以確定病原菌基因在宿主中的表達(dá)情況。
微生物基因組序列測(cè)定完成后,后基因組學(xué)的主要目標(biāo)應(yīng)是,綜合利用各學(xué)科的優(yōu)勢(shì)與技術(shù),闡明各個(gè)基因的功能,找出毒力因子和具有保護(hù)宿主功能的因子,為開(kāi)發(fā)新的治療藥物和新型疫苗奠定基礎(chǔ),為防治疾病找到更加理想的途徑。目前,后基因組研究采用的主要技術(shù)有:
DNA芯片技術(shù) 美國(guó)1998年正式啟動(dòng)“BIOCHIP”計(jì)劃。DNA芯片技術(shù)的基本原理是:①合成成千上萬(wàn)特異的寡核苷酸探針,密集點(diǎn)布并固定在只有郵票大小的硅片、玻片或尼龍膜等固相支持物上,即制成DNA芯片;②抽提不同條件下的樣本mRNA,用熒光染料標(biāo)記后,與DNA芯片上的列陣探針雜交;③應(yīng)用共聚焦顯微鏡掃描,記錄雜交結(jié)果,對(duì)雜交位點(diǎn)及其信號(hào)強(qiáng)弱進(jìn)行分析,找出差異表達(dá)的基因。通過(guò)電腦分析,可以判別標(biāo)本中的特異性病原。
DNA芯片可用于基因診斷、設(shè)計(jì)基因藥物等。例如,結(jié)核分枝桿菌H37RV株全基因組序列為4.41Mb,有3 924個(gè)開(kāi)放讀碼框編碼蛋白質(zhì),用含97%開(kāi)放讀碼框的DNA芯片檢測(cè)結(jié)核分枝桿菌對(duì)異煙肼反應(yīng)的基因,發(fā)現(xiàn)異煙肼誘導(dǎo)表達(dá)的基因包括一個(gè)操縱子基因簇,由5個(gè)基因組成。利用DNA芯片,比較結(jié)核分枝桿菌H37Rv、牛型結(jié)核分枝桿菌和卡介苗3個(gè)菌株之間的差異,分析卡介苗保護(hù)效果不一致的原因,得到一些有意義的結(jié)果,證明卡介苗菌株一直在不斷演變。
體內(nèi)表達(dá)技術(shù)(in vivo expression technology) 首先要建立DNA文庫(kù),將DNA片段與某www.med126.com些缺失了啟動(dòng)子的基因連接,只有插入的DNA片段具有啟動(dòng)子活性,細(xì)菌才能在宿主體內(nèi)生存。識(shí)別這些基因,可以初篩不同入侵階段表達(dá)的基因及其對(duì)致病的影響程度,以及宿主如何控制致病菌基因的表達(dá)。
基因中斷技術(shù)(gene disruption) 包括條碼標(biāo)記轉(zhuǎn)座子誘變(signature-tagged transposon)和等位交換(allelic exchange)等方法,其原理是:帶標(biāo)記的具有不同特征的轉(zhuǎn)座子或質(zhì)粒DNA片段稱為tag。tag一般約為80bp,可分為臂和可變區(qū)兩部分,臂位于兩端,可供設(shè)計(jì)PCR引物。用帶tag的轉(zhuǎn)座子或質(zhì)粒構(gòu)建不同基因被中斷的突變株,獲得的突變株各有一個(gè)特異的tag。用一組帶不同tag的突變株接種動(dòng)物模型,篩選突變后毒力減弱或消失的突變株,從而鑒定出毒力基因。
基因互補(bǔ)法(gene complement) 將毒力株的基因克隆到同種或近種無(wú)毒/弱毒株中,觀察毒力的改變及程度,篩選使后者毒力增強(qiáng)的基因。應(yīng)用該方法發(fā)現(xiàn)結(jié)核分枝桿菌H37Rv株有EIS(enhanceintracellular survival)基因,而在牛型結(jié)核分枝桿菌和卡介苗中不存在。
差異熒光誘導(dǎo)法(differential fluorescent induction) 用于識(shí)別被宿主特定細(xì)胞和特定條件誘導(dǎo)的病原體基因及其啟動(dòng)子。常用綠色熒光蛋白(GFP)作為標(biāo)記,可以自動(dòng)化、高通量篩選,不涉及代謝營(yíng)養(yǎng)要求。
雙向凝膠電泳與質(zhì)譜技術(shù) 蛋白質(zhì)是生物功能的主要表現(xiàn)者,是致病微生物主要的致病因子之一。細(xì)胞內(nèi)全部蛋白質(zhì)及其活動(dòng)方式稱為蛋白質(zhì)組。蛋白質(zhì)組學(xué)(proteomics)是在基因組學(xué)基礎(chǔ)上形成的新興學(xué)科,是以蛋白質(zhì)組為研究對(duì)象,從分子水平上研究細(xì)胞內(nèi)蛋白質(zhì)的組成及其生命活動(dòng)的規(guī)律。蛋白質(zhì)組可以分析非轉(zhuǎn)錄水平控制的細(xì)胞過(guò)程,補(bǔ)充DNA芯片等技術(shù)的不足。同基因組相比,蛋白質(zhì)組在時(shí)間、空間上具多樣性,變化性大。蛋白質(zhì)組學(xué)的研究主要包括:①細(xì)菌新蛋白質(zhì)及蛋白質(zhì)翻譯后修飾的鑒定;②細(xì)菌在不同狀態(tài)下的蛋白組學(xué)的比較;③細(xì)菌蛋白質(zhì)之間的相互作用,有助于設(shè)計(jì)新的防治微生物感染的方案。
蛋白質(zhì)組學(xué)需要各種類型的技術(shù)支撐,包括分離蛋白質(zhì)的凝膠電泳技術(shù)如雙向聚丙烯凝膠電泳(2D-PAGE),確定蛋白質(zhì)特性的質(zhì)譜(MS)分析技術(shù)等,并在不斷發(fā)展新的研究技術(shù),可以一次分離幾千甚至上萬(wàn)蛋白質(zhì)點(diǎn)和鑒定出翻譯后加工的機(jī)制。
獲得微生物全基因組序列是認(rèn)識(shí)微生物完整生物學(xué)功能的基礎(chǔ)。完整的基因組序列資料有助于更精確地研究微生物的形態(tài)發(fā)生、生長(zhǎng)代謝、遺傳變異,鑒定有關(guān)的毒力及致病基因和抗微生物藥物作用的靶位,為研制和發(fā)展特異的診斷試劑和疫苗提供參考。
闡明病原微生物致病基因及其產(chǎn)物,對(duì)于了解其致病機(jī)制至關(guān)重要。根據(jù)病原微生物的全基因序列,應(yīng)用現(xiàn)代生物信息軟件對(duì)基因序列進(jìn)行分析,可以確定哪些基因與毒力有關(guān),那些與體內(nèi)定居有關(guān),哪些與體內(nèi)持續(xù)感染有關(guān)。例如,流感嗜血桿菌的全基因序列測(cè)定完成后,很快就鑒定出25種與脂多糖生物合成相關(guān)的新基因,而在此之前僅發(fā)現(xiàn)7個(gè)基因。又如,研究發(fā)現(xiàn),結(jié)核分枝桿菌異枸櫞酸裂解酶基因和環(huán)丙烷合成酶編碼基因是造成持續(xù)感染的關(guān)鍵基因。異枸櫞酸裂解酶在細(xì)菌利用脂肪酸為碳源的代謝中十分重要。當(dāng)結(jié)核分枝桿菌侵入機(jī)體后,免疫系統(tǒng)介入,感染則由急性轉(zhuǎn)入持續(xù)感染,該菌轉(zhuǎn)為利用脂肪酸作為碳源這一代謝旁路。
通過(guò)全基因組測(cè)序及菌種(株)間基因組比較,發(fā)現(xiàn)一些可在細(xì)胞表面定居的細(xì)菌(如流感嗜血桿菌)的表面粘附分子受多重重復(fù)序列(multiple repeating sequences)控制,故可將該序列作為細(xì)菌粘膜定居的標(biāo)記基因。比較結(jié)核分枝桿菌與卡介苗的全基因組序列時(shí)發(fā)現(xiàn),卡介苗的一些菌株有16個(gè)區(qū)段存在核苷酸缺失,長(zhǎng)度為1903~12 733bp不等。
由于細(xì)菌的致病基因往往有特殊的核苷酸序列,因此,在全基因組序列測(cè)定的基礎(chǔ)上,用計(jì)算機(jī)分析可找出毒力基因的熱點(diǎn)區(qū)—毒力島(pathogenicity island)。毒力島是一組編碼細(xì)菌毒力的基因簇,為染色體上一個(gè)分子量較大(>30kb)的DNA片段,常位于tRNA位點(diǎn)內(nèi)或其附近,兩側(cè)可有重復(fù)序列(RS)或插入序列(IS)。毒力島的發(fā)現(xiàn)為研究細(xì)菌的致病性和毒力因子提供了有效的途徑。但有關(guān)細(xì)菌毒力島的來(lái)源及其在不同細(xì)菌間水平轉(zhuǎn)移的機(jī)制尚不清楚。
對(duì)病原菌致病基因研究的傳統(tǒng)方法是采用單個(gè)基因敲除或突變的方法,即通過(guò)觀察某一基因的喪失或突變對(duì)病原菌功能的影響,然后通過(guò)動(dòng)物模型,確定該基因與細(xì)菌致病作用的關(guān)系。但該方法具有明顯的局限性,難以從病原菌眾多的基因中鑒定出致病基因及致病基因間的相互關(guān)系。近年發(fā)展的條碼標(biāo)記誘變技術(shù)可同時(shí)誘變多至100個(gè)基因,產(chǎn)生基因敲除突變庫(kù),并在各個(gè)被敲除的基因原位插入各自獨(dú)特的易被鑒定的條碼。將這些突變菌株分別接種動(dòng)物,并觀察它們?cè)趧?dòng)物中的致病能力。通過(guò)鑒定該突變菌的特定條碼,即可從基因敲除突變庫(kù)中篩選出某一致病相關(guān)基因。應(yīng)用這種“條碼標(biāo)記誘變”技術(shù)已成功地應(yīng)用于多種重要病原菌(如傷寒沙門菌、金黃色葡萄球菌及霍亂弧菌等)的致病性研究。
目前,對(duì)病毒的基因組研究已進(jìn)入后基因組階段,即從全基因水平研究病毒的生物學(xué)功能,發(fā)現(xiàn)與致病及誘發(fā)免疫應(yīng)答相關(guān)的基因,從而揭示病毒與宿主之間的相互作用。例如,對(duì)病毒基因組或基因變異研究,有可能揭示致腫瘤病毒的部分致病機(jī)制,揭示與持續(xù)性感染相關(guān)的基因、基因變異或調(diào)控因子。
可以預(yù)見(jiàn),在微生物基因組學(xué)的基礎(chǔ)上,細(xì)胞微生物學(xué)、微生態(tài)學(xué)、微生物生理學(xué)將從分子水平和細(xì)胞水平上揭示微生物之間、微生物與宿主之間、微生物和宿主與環(huán)境之間的相互作用,更深入地闡明病原微生物的致病機(jī)制,諸如細(xì)胞中微生物的受體,侵入細(xì)胞內(nèi)微生物的定位和新表位的發(fā)現(xiàn),對(duì)細(xì)胞器的影響和作用,宿主神經(jīng)系統(tǒng)和免疫系統(tǒng)的反應(yīng)等,從而更好地維持人體微生態(tài)平衡,提高機(jī)體抵抗力。
傳統(tǒng)的病原學(xué)監(jiān)測(cè)和診斷依賴于致病微生物的形態(tài)和培養(yǎng)特征。通過(guò)測(cè)定多種致病與非致病微生物的基因組序列,可以獲得大量的基因信息。如特異DNA序列用于診斷,菌株特異性基因用于分型,特異性毒力基因用于判斷疾病進(jìn)展,耐藥基因用于預(yù)測(cè)臨床治療效果等。
近年來(lái),微生物全基因序列測(cè)定工作的進(jìn)展,使微生物的分子診斷技術(shù)發(fā)生了革命性的變化。例如,運(yùn)用多對(duì)引物同時(shí)對(duì)多個(gè)可能的靶DNA片段進(jìn)行擴(kuò)增的“多重PCR”技術(shù),不僅大大提高了診斷效率,還可對(duì)單一標(biāo)本作出多種常見(jiàn)病原體的診斷。最近發(fā)展的DNA芯片技術(shù)更是核酸雜交技術(shù)的一次革命性飛躍,其用途包括:①鑒定病原微生物種類,進(jìn)行臨床診斷;②用特異的寡核苷酸探針對(duì)病原微生物進(jìn)行型或亞型分類;③用毒性基因或抗性基因特異的寡核苷酸探針預(yù)測(cè)疾病進(jìn)展,監(jiān)測(cè)抗微生物藥物的療效等。
自1973年以來(lái)新現(xiàn)病原微生物有30多種,再現(xiàn)病原微生物有20多種,對(duì)人類的生存和發(fā)展構(gòu)成巨大的威脅。但是,人類迄今未能研制出特效抗病毒藥物,抗生素的泛用和濫用導(dǎo)致耐藥菌株不斷增加。因此,迫切需求發(fā)展新型高效的抗微生物藥物。
病原菌全基因組序列的測(cè)定,一方面能揭示細(xì)菌耐藥的確切機(jī)制,對(duì)現(xiàn)有抗菌藥物進(jìn)行改造或開(kāi)發(fā)新型藥物;另一方面可找到對(duì)細(xì)菌生存必不可少并在感染過(guò)程中常優(yōu)先表達(dá)的因子,選擇這些因子作為抗菌藥物的靶位點(diǎn),可設(shè)計(jì)出具有針對(duì)性很強(qiáng)的藥物。通過(guò)與人類基因組序列比較,還可及早排除與人類同源的靶位,避免對(duì)人的毒副作用,降低藥物開(kāi)發(fā)風(fēng)險(xiǎn)。
病原微生物全基因組序列的測(cè)定還可大大加速新疫苗的研制。通過(guò)先進(jìn)的計(jì)算機(jī)軟件對(duì)全基因組序列進(jìn)行分析,可以預(yù)測(cè)出病原體的保護(hù)性抗原。這類蛋白抗原通常表達(dá)于細(xì)胞表面,并具有很高的免疫原性。從病原微生物全基因組序列中直接篩選高免疫原性的分析系統(tǒng)的開(kāi)發(fā)與應(yīng)用,將為預(yù)防及治療性疫苗的研制提供極大便利。
本世紀(jì)初,微生物基因組學(xué)的成就將很快體現(xiàn)在微生物產(chǎn)業(yè)中。通過(guò)構(gòu)建更多高效的基因工程菌,可生產(chǎn)出各種外源基因表達(dá)的產(chǎn)物,包括抗癌、抗病毒、調(diào)節(jié)宿主免疫功能的藥物,以基因?yàn)榘袠?biāo)的新藥物(包括反義寡核苷酸、核酶和DNA疫苗等)也將投放市場(chǎng)。
微生物全基因組序列的測(cè)定和分子生物學(xué)技術(shù)的飛速發(fā)展及應(yīng)用,將為人們提供更多的關(guān)于微生物致病性及其與宿主之間相互關(guān)系的信息。深入研究病原微生物如何利用宿主細(xì)胞功能,將有助于加深對(duì)細(xì)胞微生物學(xué)的認(rèn)識(shí)。
某些蛋白與人類一些遺傳性疾。ㄈ邕z傳性非息肉性結(jié)腸癌、肝豆?fàn)詈俗冃?/a>、腎上腺腦白質(zhì)營(yíng)養(yǎng)不良癥等)關(guān)系密切。微生物基因組序列的分析表明,在某些微生物中存在這些蛋白的類似物。通過(guò)以這些微生物為模型,可以研究這些蛋白及其編碼基因在人類遺傳性疾病中的作用。例如,腎上腺腦白質(zhì)營(yíng)養(yǎng)不良癥患者的神經(jīng)退行性病變,是由長(zhǎng)鏈脂肪酸代謝障礙引起的。研究發(fā)現(xiàn),與此代謝有關(guān)的兩個(gè)基因的類似序列在釀酒酵母菌中也存在。通過(guò)對(duì)酵母菌相關(guān)基因的研究,表明這兩個(gè)基因與激活長(zhǎng)鏈脂肪酸的轉(zhuǎn)運(yùn)有關(guān)。據(jù)此推測(cè)該基因缺陷在腎上腺腦白質(zhì)營(yíng)養(yǎng)不良癥發(fā)生中起類似的作用。因此,微生物全基因組序列測(cè)定及相關(guān)基因功能研究,有助于推測(cè)特定基因變異在人類遺傳性疾病中的作用,提高對(duì)人類遺傳性疾病的診斷和治療水平。
據(jù)新近的估計(jì),微生物的生物量占整個(gè)地球生物量的60%,而目前已知的微生物物種數(shù)占地球上實(shí)際存在的數(shù)量還不到10%,因此,尋找和鑒定微生物的工作將是微生物學(xué)家的一項(xiàng)重要任務(wù)。隨著微生物基因組全序列數(shù)據(jù)的迅速增加,人們對(duì)微生物在生命世界中的進(jìn)化地位將有更準(zhǔn)確的界定,對(duì)微生物之間的親緣關(guān)系會(huì)有更深刻的了解,鑒定新發(fā)現(xiàn)微生物的能力迅速得到提高,并加深對(duì)基因功能的認(rèn)識(shí),發(fā)現(xiàn)更多的前所未有的新功能。例如,新近對(duì)詹氏甲烷球菌(Methanococcusjannaschii)全序列測(cè)定的結(jié)果證實(shí)了微生物學(xué)家曾經(jīng)提出的第3生物的科學(xué)預(yù)見(jiàn),并有助于從分子水平上了解產(chǎn)生甲烷的遺傳性狀和基因調(diào)控。又如。對(duì)特別能耐受輻射的耐輻射球菌(Deinococcusradiodurans)基因組序列的測(cè)定和功能的研究,發(fā)現(xiàn)該菌具有超常的修復(fù)輻射損傷的能力,有可能利用其來(lái)消除環(huán)境中的重金屬和毒物污染。同樣,可以利用那些能夠生活在極冷、極熱或高壓、高鹽、高酸等極端環(huán)境中的細(xì)菌的功能基因,通過(guò)基因工程來(lái)改良農(nóng)作物和家畜,甚至有可能讓人類“學(xué)會(huì)”細(xì)菌的這些生活能力。
結(jié)束語(yǔ)
隨著為數(shù)眾多的微生物基因組被解碼和微生物功能基因組的研究與開(kāi)發(fā),微生物學(xué)正面臨著革命性的飛躍。微生物基因組研究所獲得的信息將迅速地轉(zhuǎn)化為生產(chǎn)力,主要表現(xiàn)為微生物感染性疾病的防治與診斷將會(huì)徹底得到改觀,微生物作為模式生物將進(jìn)一步促進(jìn)生物學(xué)和生命科學(xué)的發(fā)展。
微生物基因組學(xué)的研究為生命科學(xué)開(kāi)辟了新的研究領(lǐng)域,如生物信息學(xué)、比較基因組學(xué)、功能基因組學(xué)等,也帶來(lái)了新的研究思路和策略。生物信息學(xué)是用數(shù)理和信息科學(xué)的觀點(diǎn)、理論和方法,研究蛋白質(zhì)和核酸序列的結(jié)構(gòu)與功能的一門生物學(xué)與計(jì)算機(jī)信息交叉的學(xué)科,其主要內(nèi)容有二個(gè):一是收集基因組和蛋白質(zhì)組的數(shù)據(jù);二是分析、解釋基因組和蛋白質(zhì)組的內(nèi)涵。可見(jiàn),生物信息學(xué)將生命科學(xué)由傳統(tǒng)的實(shí)驗(yàn)科學(xué)提升為理論科學(xué),將成為21世紀(jì)生物技術(shù)的核心。
通過(guò)對(duì)多種微生物的基因組作比較,可以鑒定出哪些基因是某些特定功能所必需的,確定哪些基因與病原菌的致病或毒力有關(guān),而這些基因的蛋白產(chǎn)物可能是具有很高免疫原性或抗菌藥物作用的靶位點(diǎn)。比較基因組學(xué)研究對(duì)進(jìn)一步了解微生物的起源、進(jìn)化和種系發(fā)育等帶來(lái)契機(jī)。
近年新興的微生物蛋白組學(xué)(microbial proteomics)技術(shù)與遺傳學(xué)、分子生物學(xué)、蛋白質(zhì)生化與生物物理學(xué)方法結(jié)合一起,可以從復(fù)雜的蛋白質(zhì)混合物中高通量分離、純化、檢測(cè)和鑒定微量蛋白質(zhì)。微生物蛋白組分析法將為進(jìn)一步研究微生物基因功能、蛋白質(zhì)與基因、蛋白質(zhì)與蛋白質(zhì)的相互作用提供有用的工具。
(郭輝玉 中山大學(xué)中山醫(yī)學(xué)院)