垃圾DNA?
探索非編碼基因的遺傳密碼,
解讀基因組中“暗物質(zhì)”存在的意義!
數(shù)十年來(lái),我們基因組里有98%的DNA因?yàn)闆](méi)有編碼蛋白質(zhì)而被稱為“垃圾”。直到最近,這些垃圾區(qū)域重要且顯著的功能才開(kāi)始為人們所了解。
從罕見(jiàn)的遺傳疾病到唐氏綜合征,從常見(jiàn)的病毒感染到衰老過(guò)程——還沒(méi)算上六個(gè)指頭的貓(以及人類中的同癥狀者)——由基因組中暗物質(zhì)導(dǎo)致的影響是常見(jiàn)、多樣和本質(zhì)性的。
科學(xué)家們?cè)谶@個(gè)備受爭(zhēng)議的領(lǐng)域中快速增長(zhǎng)的知識(shí)已經(jīng)提供了治療失明的成功療法,并挽救了被DNA指紋宣判了死刑的無(wú)辜的人,而且很可能帶來(lái)對(duì)包括肥胖在內(nèi)的很多醫(yī)學(xué)疾病的治療方法的革命。
在內(nèi)莎?凱里,也是暢銷書(shū)《遺傳的革命》的作者看來(lái),這是一本面對(duì)大眾讀者的一個(gè)可能會(huì)奠定人體復(fù)雜性觀念的圖書(shū)。
《垃圾DNA》對(duì)非編碼基因作了深入介紹。展示了科學(xué)家們?cè)趯W(xué)術(shù)領(lǐng)域逐漸發(fā)現(xiàn)的證據(jù),提示這些所謂的“垃圾DNA”的變異和調(diào)節(jié)與一些難治性疾病有關(guān)。并用不可辯駁的證據(jù)證明了“垃圾DNA”在基因的表達(dá)調(diào)控中起著重要且不可預(yù)料的作用,其作用覆蓋從單個(gè)基因的微調(diào)到整個(gè)染色體的關(guān)閉。這些功能迫使科學(xué)家們重新審視關(guān)于“基因”的定義。
《垃圾DNA》是內(nèi)莎?凱里續(xù)《遺傳的革命》出版之后又一部具有高學(xué)術(shù)性的相關(guān)遺傳學(xué)經(jīng)典力作。作者以令人信服的筆觸為讀者全面介紹了“垃圾DNA”的涵義,及其與遺傳性疾病、病毒感染、哺乳動(dòng)物性別決定和生命進(jìn)化的關(guān)系。閱讀本書(shū),我們可以緊跟科學(xué)家的腳步迅速進(jìn)入“垃圾DNA”的領(lǐng)域。而這個(gè)具有快速發(fā)展的且頗受爭(zhēng)議的領(lǐng)域,還有廣袤的未知在等著我們?nèi)ラ_(kāi)發(fā)與探索。
作者序
其實(shí)寫(xiě)一本關(guān)于垃圾DNA的書(shū)還是有些困難的,因?yàn)樗暮x一直都在不斷地演變。有部分原因是新的數(shù)據(jù)會(huì)不停地改變我們的舊有觀念,結(jié)果就是,只要一個(gè)垃圾DNA被證明事實(shí)上具有一定的功能,有些科學(xué)家就會(huì)說(shuō)(在邏輯上完全正確)它不再是垃圾。但使用這種方法有可能掩蓋掉這些年來(lái)我們對(duì)基因組的理解產(chǎn)生了何等翻天覆地變化的過(guò)程。
與其花時(shí)間在這里糾纏不清,我決定采取一個(gè)快刀斬亂麻的方法,使用一個(gè)簡(jiǎn)單粗暴的定義。把任何不能編碼蛋白的序列都定義為垃圾,如同它在過(guò)去最初的定義一般(20世紀(jì)下半葉)。純粹主義者會(huì)尖叫抗議,但就這樣決定了。問(wèn)3個(gè)不同的科學(xué)家什么是“垃圾”DNA,我們可能會(huì)得到4個(gè)不同的答案。因此,在開(kāi)始的時(shí)候就簡(jiǎn)單一點(diǎn)利大于弊。
同樣,我使用“基因”這個(gè)詞來(lái)描述編碼蛋白的那些DNA序列。這個(gè)定義會(huì)貫穿本書(shū)的始終。
在我的第一本書(shū)《遺傳的革命》出版后,我意識(shí)到不同的讀者對(duì)基因名稱的需求差異很大。有些人喜歡知道我們正在討論的是哪個(gè)基因,但對(duì)于其他讀者而言,這或許會(huì)干擾閱讀的流暢性。所以這次,我只在絕對(duì)必要的情況下才使用具體的基因名稱。
對(duì)基因組暗物質(zhì)的介紹
想象一下現(xiàn)在你手里有一個(gè)戲劇、一部電影、一部電視節(jié)目的劇本。當(dāng)然,完全可能有人僅僅把劇本當(dāng)成一本書(shū)來(lái)看。但是,如果它被用來(lái)產(chǎn)生某些東西的時(shí)候,它會(huì)變得更有力量。在被大聲朗讀出來(lái),甚至被表演出來(lái)時(shí),它就不再僅是頁(yè)面上的一串字符而已了。
DNA就是如此,它是最杰出的劇本。僅使用4個(gè)簡(jiǎn)單的字母,它就攜帶了生命的所有編碼,從細(xì)菌到大象、從啤酒酵母到藍(lán)鯨。但試管中的DNA是很無(wú)聊的,它完全沒(méi)有用處。而細(xì)胞或動(dòng)物開(kāi)始用它進(jìn)行生產(chǎn)的時(shí)候,DNA就會(huì)變得令人興奮。DNA被作為制造蛋白的編碼,這些蛋白對(duì)呼吸、進(jìn)食、排泄廢物、生殖和所有其他生命特有的活動(dòng)都至關(guān)重要。
蛋白的功能是如此重要,以至于20世紀(jì)的科學(xué)家使用它們來(lái)界定基因的含義。基因就是能夠編碼蛋白的DNA序列。
讓我們來(lái)懷念一下歷史上最偉大的劇作家威廉姆.莎士比亞(William Shakespeare)。我們可能需要一段時(shí)間才能理解莎士比亞的著作,因?yàn)橛⒄Z(yǔ)從他去世的那個(gè)世紀(jì)起已發(fā)生了不小的改變。但即使如此,我們?nèi)匀幌嘈,?shī)人僅書(shū)寫(xiě)了他需要演員說(shuō)的那些話。
例如,莎士比亞不會(huì)像下面這么寫(xiě)劇本:
事實(shí)上,他只寫(xiě)了劃線部分的單詞:
就是“A rose by any other name would smell as sweet(即使給玫瑰換個(gè)稱謂,它依然芳香如故)”。
但如果看看我們自己的DNA劇本,它并不像莎士比亞那些劃了線的詞語(yǔ)那么清晰和緊湊。相反,每個(gè)編碼蛋白的區(qū)域就像是漂浮在“廢話海洋”上的一個(gè)詞。
多年來(lái),科學(xué)家們并不能解釋為什么那么多的DNA不編碼蛋白。這些非編碼的部分被誤會(huì)成“垃圾DNA”。但漸漸的,這個(gè)看法已經(jīng)被一大堆理由逼迫得站不住腳了。
也許,轉(zhuǎn)變?cè)撚^點(diǎn)最根本的原因是源于我們細(xì)胞中垃圾DNA那驚人的總量。其中一個(gè)最大的沖擊來(lái)自2001年人類基因組測(cè)序完成的時(shí)候,人們發(fā)現(xiàn)人類細(xì)胞中98%以上的DNA被劃入了垃圾的行列。它不編碼任何蛋白。上面使用的莎士比亞的比喻實(shí)際上是一個(gè)精簡(jiǎn)了的模型。在基因組里,亂七八糟的文字的比例約為前面提到的亂序劇本的4倍。每一個(gè)有意義的字母都對(duì)應(yīng)著超過(guò)50個(gè)字母的垃圾文字。
還有一個(gè)類似的比喻。請(qǐng)想象下我們?nèi)⒂^一個(gè)汽車廠,這家汽車廠也許像法拉利那么高端。如果我們看到只需要兩個(gè)人就能造好一輛炫酷的紅色跑車,而同時(shí)又有98個(gè)人在一旁無(wú)所事事的話一定很驚訝。這顯然是荒謬的,那么為什么這在我們的基因組里是合理存在的?當(dāng)然,你可以說(shuō)從共同祖先進(jìn)化而來(lái)的生物往往不是完美的——比如我們?nèi)祟惥痛_實(shí)不需要闌尾(本書(shū)中作者多次以闌尾為例說(shuō)明人體確實(shí)存在一些無(wú)功能的器官,但此觀點(diǎn)尚存爭(zhēng)議,因?yàn)橛醒芯空哒J(rèn)為闌尾在免疫和消化方面仍具有一定的功能。)——但這次似乎不完美得有點(diǎn)過(guò)頭了。
事實(shí)上,在我們的汽車廠里,更可能的情況應(yīng)該是,由兩個(gè)人組裝一輛汽車,其他的98個(gè)人做著其他一切使這家企業(yè)運(yùn)轉(zhuǎn)的工作。融資、記帳、宣傳產(chǎn)品、處理養(yǎng)老金、打掃廁所和汽車銷售等,這可能是一個(gè)更好的垃圾DNA在我們基因組里工作的模式。我們可以把蛋白作為生命所需的最終物質(zhì),但如果沒(méi)有垃圾DNA的話,它們永遠(yuǎn)不會(huì)被正確地生產(chǎn)和整合出來(lái)。確實(shí),兩人就能制造汽車,但他們不能保證公司可以出售汽車,也不能把它變成一個(gè)強(qiáng)大且成功的品牌。同樣,如果沒(méi)有汽車被生產(chǎn)出來(lái),就算有98個(gè)員工在展廳拖地板和磨破嘴皮子也沒(méi)有任何意義。只有每個(gè)組件各司其職的時(shí)候整個(gè)組織才能運(yùn)轉(zhuǎn)。而這,就是我們基因組的模式。
另一個(gè)來(lái)自基因組測(cè)序的令人震驚的事實(shí)是,使用經(jīng)典的基因模型無(wú)法解釋人類極其復(fù)雜的解剖結(jié)構(gòu)、生理功能、智力和行為。在編碼蛋白的基因的數(shù)量上,人體跟簡(jiǎn)單而微小的蠕蟲(chóng)幾乎具有相同的數(shù)量(大約20 000個(gè))。更值得注意的是,大部分蠕蟲(chóng)的基因跟人類基因可以直接等效。
當(dāng)研究人員想在DNA水平上深入分析人類與其他生物到底有什么區(qū)別的時(shí)候,很明顯,基因不能提供解釋。事實(shí)上,遺傳物質(zhì)只有一個(gè)特征與復(fù)雜性相關(guān)。這個(gè)唯一的隨著動(dòng)物復(fù)雜性增加而增加的就是垃圾DNA區(qū)域。一個(gè)生命體越復(fù)雜,垃圾DNA所占的百分比就越高。只有現(xiàn)在,科學(xué)家們才真正開(kāi)始關(guān)注這個(gè)有爭(zhēng)議的觀點(diǎn),就是垃圾DNA可能是進(jìn)化復(fù)雜性的關(guān)鍵。
從某個(gè)角度看,這些數(shù)據(jù)所引出的問(wèn)題是很明顯的。如果垃圾DNA是如此的重要,那它到底是干什么的?如果不編碼蛋白,它在細(xì)胞中的作用是什么?現(xiàn)在人們逐漸接受了垃圾DNA其實(shí)具有多種不同功能的觀點(diǎn),所以對(duì)下面的敘述我們并不會(huì)感到吃驚。
它們中的一些在染色體(我們的DNA被打包成的巨大分子)中形成特殊的結(jié)構(gòu)。這種垃圾DNA保護(hù)我們的DNA不被解體和受損。隨著我們年齡的增長(zhǎng),這些區(qū)域不斷縮小,最后縮小到臨界程度。之后,我們的遺傳物質(zhì)就變得很容易遭遇潛在的災(zāi)難性的重排,從而導(dǎo)致細(xì)胞的死亡或癌變。其他結(jié)構(gòu)類型的垃圾DNA在細(xì)胞分裂成子細(xì)胞過(guò)程中進(jìn)行染色體均分時(shí)作為錨點(diǎn)。(“子細(xì)胞”是指由親代細(xì)胞分裂產(chǎn)生的細(xì)胞。)其他的則作為絕緣結(jié)構(gòu),限制了特定區(qū)域染色體的基因表達(dá)。
但是我們很多的垃圾DNA并不僅僅具有上面提到的功能。它確實(shí)不編碼蛋白質(zhì),但它卻編碼另外一種分子,我們稱之為RNA。垃圾DNA里面有很大一類在細(xì)胞內(nèi)建造工廠,來(lái)幫助蛋白質(zhì)的合成。其他類型的RNA分子負(fù)責(zé)將制造蛋白質(zhì)所需的原料轉(zhuǎn)移到工廠里面。
另外有些垃圾DNA是來(lái)自病毒和其他微生物的遺傳物質(zhì)的入侵,它們已經(jīng)如遺傳間諜般融入了人類染色體中。這些早已死去的生物的殘留物對(duì)細(xì)胞有著潛在的危險(xiǎn),有些在個(gè)體中,而有的甚至存在于廣泛的人群中。哺乳動(dòng)物細(xì)胞已進(jìn)化出多種機(jī)制來(lái)使這些病毒元件保持沉默,但有的時(shí)候這些系統(tǒng)可以被打破。當(dāng)出現(xiàn)這種問(wèn)題的時(shí)候,它們所產(chǎn)生的影響可以是相對(duì)良性的,比如特定種系小鼠毛色的改變,也可以是很嚴(yán)重的,比如增加罹患癌癥的風(fēng)險(xiǎn)。
就在前幾年,人們認(rèn)識(shí)到垃圾DNA的一個(gè)主要作用其實(shí)是調(diào)節(jié)基因的表達(dá)。有時(shí)候,它在個(gè)體上會(huì)有巨大的、明顯的效果。比如,一個(gè)垃圾DNA就可以決定雌性動(dòng)物能否保持正確的基因表達(dá)模式。它的作用也可以是在群體中的,一個(gè)最常見(jiàn)的例子是虎斑貓顏色特征的控制。在極端的例子中,該機(jī)制也能解釋為什么有同樣遺傳性疾病的同卵雙胞胎女性會(huì)出現(xiàn)截然不同的癥狀。在某些情況下,情況可以極端到雙胞胎中的一個(gè)罹患了嚴(yán)重危及生命的疾病,而另一個(gè)則是完全健康的。
成千上萬(wàn)的垃圾DNA片段被認(rèn)為參與了調(diào)控基因表達(dá)的網(wǎng)絡(luò)。它們就像是遺傳劇本的舞臺(tái)導(dǎo)演一樣,只是其指導(dǎo)對(duì)象的復(fù)雜性是我們?cè)趧≡豪餆o(wú)法想象的。它絕對(duì)不是“出去,被熊追趕”那么簡(jiǎn)單。而應(yīng)該是類似于“如果在溫哥華和珀斯的暴風(fēng)雨中表演《哈姆雷特》,就應(yīng)該重讀《麥克白》這一行的第四音節(jié)。除非有個(gè)業(yè)余演員在蒙巴薩表演《理查三世》而且基多在下雨!
研究人員剛剛才開(kāi)始揭開(kāi)垃圾DNA龐大網(wǎng)絡(luò)中的奧秘和關(guān)聯(lián)的一角。這個(gè)領(lǐng)域仍極具爭(zhēng)議。在極端的情況下,有科學(xué)家聲稱有些武斷的說(shuō)法嚴(yán)重缺乏實(shí)驗(yàn)證據(jù)的支持。其他有些人則覺(jué)得有整整一代科學(xué)家(甚至更多)被困在一個(gè)過(guò)時(shí)的模型中而無(wú)法看到或者理解這個(gè)新領(lǐng)域。
有部分原因是,我們可以用來(lái)探索垃圾DNA功能的手段還比較落后。這有時(shí)會(huì)讓研究人員很難使用實(shí)驗(yàn)來(lái)檢驗(yàn)他們的假設(shè)。確實(shí),我們對(duì)該領(lǐng)域的研究時(shí)間還相對(duì)較短。但有時(shí)候,我們可以從實(shí)驗(yàn)室的板凳跟機(jī)器旁退出來(lái),去草坪轉(zhuǎn)轉(zhuǎn)。實(shí)驗(yàn)每天都在我們身邊發(fā)生,因?yàn)樽匀缓瓦M(jìn)化已經(jīng)使用了幾十億年的時(shí)間來(lái)嘗試各種變化。即使僅僅在我們這個(gè)物種出現(xiàn)和繁衍的時(shí)間段,也已經(jīng)有足夠的時(shí)間來(lái)進(jìn)行大規(guī)模的實(shí)驗(yàn)測(cè)試。因此,我們將在本書(shū)中利用人類遺傳學(xué)的火炬來(lái)探索黑暗。
可以有許多方法來(lái)開(kāi)始我們的探究基因組暗物質(zhì)之旅,這里,讓我們用一個(gè)有些奇怪但不容置疑的事實(shí)來(lái)開(kāi)始。一些遺傳病是由垃圾DNA的突變引起的,這應(yīng)該是我們進(jìn)入隱藏的基因組宇宙的最好起點(diǎn)。