對(duì)很多人來(lái)說(shuō),基因測(cè)序儀都是一個(gè)很陌生的名詞。然而,如果你感受過獨(dú)步世界的中國(guó)高鐵技術(shù),見證過中國(guó)發(fā)射的量子衛(wèi)星,還聽說(shuō)過獨(dú)占世界超算排行榜長(zhǎng)達(dá)五年的中國(guó)超級(jí)計(jì)算機(jī),那么處于全球領(lǐng)先地位的中國(guó)基因測(cè)序儀也絕對(duì)值得一探究竟。
人們常說(shuō),19世紀(jì)是蒸汽機(jī)的世紀(jì),20世紀(jì)是汽車和計(jì)算機(jī)的世紀(jì),而21世紀(jì)則是生命科學(xué)的世紀(jì)。生命科學(xué)研究將在醫(yī)療健康、體育運(yùn)動(dòng)、農(nóng)業(yè)養(yǎng)殖、司法刑偵、太空探索等眾多方面廣泛而深遠(yuǎn)地改造人類生活。作為生命科學(xué)研究最核心的基礎(chǔ)性工具,基因測(cè)序儀已經(jīng)成為當(dāng)前中美全面科技競(jìng)爭(zhēng)的重要領(lǐng)域。
什么是基因測(cè)序
基因測(cè)序技術(shù)是基因組學(xué)研究的核心技術(shù),是現(xiàn)代生命科學(xué)研究中最廣泛應(yīng)用的重要技術(shù)。你可能還不知道,地球上幾乎所有你能看見和看不見的生命形式都是由基因編碼而成的。塞滿商場(chǎng)的人類、賣萌為生的熊貓,爬過陽(yáng)臺(tái)的甲蟲、各類叫不上名字的樹木花草以及數(shù)萬(wàn)億和我們親密接觸的細(xì)菌、微生物,都是由DNA編碼的生命體。
每一個(gè)生命都像是執(zhí)行一段代碼的程序,而DNA正是生命的源代碼。相應(yīng)地,破解生命源代碼的技術(shù),就是DNA測(cè)序。
發(fā)現(xiàn)雙螺旋——讓測(cè)序成為可能
如果說(shuō)測(cè)序技術(shù)的進(jìn)步是發(fā)掘礦藏的過程,那么還需要先行者告訴我們礦藏的方向和位置。完成這項(xiàng)任務(wù)的,正是科學(xué)界的兩位頂尖人物——沃森和克里克。
雙螺旋結(jié)構(gòu)的發(fā)現(xiàn)者James Watson和Francis Crick
1953年,沃森和克里克發(fā)現(xiàn)了DNA雙分子螺旋結(jié)構(gòu),人類對(duì)生命的認(rèn)識(shí)有了重大的突破,即:“生命是序列的,生命是數(shù)據(jù)的?!鄙w的全基因組包含了其全部遺傳信息,這些信息是A-T、C-G四種堿基兩兩配對(duì)后排列成的長(zhǎng)鏈。這些堿基的排列信息可以被讀取出來(lái),以1010001的二進(jìn)制形式存儲(chǔ)在計(jì)算機(jī)中;可見,生命的密碼是一組可以被數(shù)據(jù)化的堿基排布序列。因此,測(cè)定DNA序列就成為解讀遺傳信息的先決條件和整個(gè)生命科學(xué)研究的重要基礎(chǔ)。
可以說(shuō),正是DNA雙螺旋結(jié)構(gòu)的發(fā)現(xiàn),帶動(dòng)了DNA測(cè)序技術(shù)的大發(fā)展,開啟了人類歷史上方向明確而歷時(shí)長(zhǎng)久、道路曲折、投入巨大、進(jìn)展驚人的探索。
測(cè)序技術(shù)發(fā)展的四個(gè)階段
DNA雙螺旋的發(fā)現(xiàn),讓破解生命源代碼的DNA測(cè)序在原理上成為可能,現(xiàn)在我們就來(lái)回顧測(cè)序技術(shù)的具體發(fā)展,其主要經(jīng)歷了四個(gè)階段。因篇幅所限,這篇文章將為你展示前兩個(gè)階段。
階段1:從“前直讀”到“直讀”
1964年,即DNA螺旋被發(fā)現(xiàn)11年后,康奈爾大學(xué)的研究者第一次分析了酵母的核苷酸序列。這次研究標(biāo)志著一個(gè)新時(shí)代的開始。不過,正如承載生命信息的大分子經(jīng)歷了從RNA到DNA的歷程,最開始的測(cè)序方法是用來(lái)測(cè)定RNA序列的,實(shí)驗(yàn)用不同的RNA酶對(duì)RNA模板進(jìn)行“消化”(digestion),并根據(jù)反應(yīng)后產(chǎn)物中可能重疊的序列間接推導(dǎo)可能的完整序列。這種測(cè)序技術(shù)流程繁瑣,推導(dǎo)復(fù)雜,很難重復(fù),驗(yàn)證還更為困難。不僅如此,在試圖測(cè)定雙鏈且更加穩(wěn)定的DNA時(shí),這種方法沒能獲得成功。
直讀法示例
在技術(shù)的發(fā)展史上,新技術(shù)的出現(xiàn)就像制作一個(gè)木桶,每一塊木板都代表一種必須具備的基礎(chǔ)條件,任意一塊板的缺失都不構(gòu)成一個(gè)木桶,同時(shí),木板之間還需要彼此適應(yīng)和融合。直接讀取DNA序列的測(cè)序技術(shù)(即“直讀法”),正是這樣一個(gè)木桶。它是在分子克隆技術(shù)、凝膠電泳技術(shù)、放射自顯影三種技術(shù)全部成熟之后才出現(xiàn)的。在這三種技術(shù)的基礎(chǔ)之上,直接讀取DNA序列的SBC和SBS測(cè)序法問世?!爸弊x法”的最大突破在于不再需要間接推導(dǎo),而是可以直接在凝膠上按順序直觀讀出測(cè)序模板,判斷DNA分子每個(gè)堿基位置上為T-C還是A-G。
SBC與SBS這兩種方法在原理上相似,但具體操作有諸多不同。SBC法使用化學(xué)試劑,有較強(qiáng)的毒性,且技術(shù)復(fù)雜較難掌握,成功率不高。相比之下,SBS法使用酶試劑,具有操作簡(jiǎn)便、結(jié)果穩(wěn)定、準(zhǔn)確性高且重復(fù)性好等特點(diǎn)。更有意思的是,運(yùn)用SBS法的設(shè)備相對(duì)簡(jiǎn)單,可以實(shí)驗(yàn)室自制或采用通用設(shè)備,還有使用方便的標(biāo)準(zhǔn)化試劑盒,因此很快風(fēng)靡全球相關(guān)實(shí)驗(yàn)室。SBS法由英國(guó)科學(xué)家桑格(Frederick Sanger)于1975年率先發(fā)明,因此也被稱為Sanger法。這種直讀法的發(fā)明也為DNA測(cè)序的數(shù)字化和自動(dòng)化奠定了基礎(chǔ)
Sanger電泳法跑膠結(jié)果示例圖
階段2:從手工到自動(dòng)化
上世紀(jì)80年代以前,分子生物學(xué)這門學(xué)科一直都被戲稱為“現(xiàn)代技術(shù)、手工操作”,直到DNA測(cè)序技術(shù)出現(xiàn),分子生物學(xué)才有了第一種實(shí)現(xiàn)自動(dòng)化和信息化的技術(shù)。此后測(cè)序技術(shù)在幾十年發(fā)展歷程中不斷吸收其他領(lǐng)域新技術(shù)(如物理領(lǐng)域的納米技術(shù)及激光技術(shù)、化學(xué)領(lǐng)域的熒光標(biāo)記核苷酸技術(shù)、生化領(lǐng)域的毛細(xì)管電泳分析、信息領(lǐng)域高密度芯片等技術(shù))并將它們?nèi)跒橐惑w的成果,形成了現(xiàn)代科學(xué)研究技術(shù)中的強(qiáng)力工具。
1986年,加州理工學(xué)院的胡德(Leroy Hood)發(fā)明了以四種熒光物質(zhì)標(biāo)記測(cè)序反應(yīng)產(chǎn)物的“四色熒光法”,這些熒光物質(zhì)在不同波長(zhǎng)的激光下呈現(xiàn)不同顏色。這項(xiàng)技術(shù)成為廣受歡迎的SBS測(cè)序法(Sanger測(cè)序法)走向自動(dòng)化的關(guān)鍵突破。
四色熒光法原理示意圖和自動(dòng)測(cè)序儀的四色熒光“峰圖”
這種方法將測(cè)序效率提高了數(shù)倍,讀長(zhǎng)達(dá)到500nt(nt:nucleotide 核苷酸,是衡量單鏈核酸的長(zhǎng)度單位),分辨率大為提高;而且,這是測(cè)序技術(shù)發(fā)展史上首次真正徹底拋棄了放射性物質(zhì)的使用。測(cè)序效率也稱為“通量“,是指單臺(tái)設(shè)備一次反應(yīng)所獲取的序列數(shù)據(jù)量。
另外,還有一個(gè)與通量同樣重要的概念——“讀長(zhǎng)”:測(cè)序儀的測(cè)序原理是將目標(biāo)DNA大量復(fù)制,然后用酶將這些DNA長(zhǎng)鏈切斷,并分別對(duì)每一小段測(cè)序,最后將這些片段拼接還原成完整的長(zhǎng)鏈。讀長(zhǎng)就是指測(cè)序儀能讀出的每一個(gè)DNA片段的長(zhǎng)度。這兩個(gè)概念很重要,后面還會(huì)經(jīng)常提到。
據(jù)此,美國(guó)ABI公司在1986年推出了第一臺(tái)商品化的平板電泳全自動(dòng)測(cè)序儀——ABI 370A。此后,該公司又推出了多種改進(jìn)型,在讀長(zhǎng)、通量、準(zhǔn)確性方面都有很大提高,這種自動(dòng)化測(cè)序儀成為劃時(shí)代的國(guó)際“人類基因組計(jì)劃(HGP)”得以啟動(dòng)的重要技術(shù)依據(jù)。
盡管這一代測(cè)序儀為“人類基因組計(jì)劃”做出了突出貢獻(xiàn),但只實(shí)現(xiàn)了測(cè)序過程的自動(dòng)化,在自動(dòng)測(cè)序之前的細(xì)菌克隆、手工制膠、手工加樣等操作都需要消耗大量的人力。一組數(shù)據(jù)可以說(shuō)明問題:在“人類基因組計(jì)劃”沖刺階段,華大在6個(gè)月的時(shí)間里完成了50萬(wàn)次成功的測(cè)序反應(yīng),共消耗了1500萬(wàn)個(gè)形狀大小與醫(yī)用“針頭”類似的移液器吸頭。
未完待續(xù),詳見下期:爆發(fā)式的進(jìn)步
小貼士
1.人類基因組計(jì)劃(Human Genome Project, HGP)
人類基因組計(jì)劃是一項(xiàng)規(guī)模宏大,跨國(guó)跨學(xué)科的科學(xué)探索工程。其宗旨在于測(cè)定組成人類染色體(指單倍體)中所包含的30億個(gè)堿基對(duì)組成的核苷酸序列,從而繪制人類基因組圖譜,并且辨識(shí)其載有的基因及其序列,達(dá)到破譯人類遺傳信息的最終目的?;蚪M計(jì)劃是人類為了探索自身的奧秘所邁出的重要一步,是繼曼哈頓計(jì)劃和阿波羅登月計(jì)劃之后,人類科學(xué)史上的又一個(gè)偉大工程。
這一計(jì)劃于1990年正式啟動(dòng)。美國(guó)、英國(guó)、法國(guó)、德國(guó)、日本和我國(guó)科學(xué)家共同參與了這一預(yù)算達(dá)30億美元的人類基因組計(jì)劃。2001年,人類基因組工作草圖發(fā)表。2003年4月14日,六國(guó)首腦共同宣布人類基因組測(cè)序勝利完成。
2.測(cè)序效率與讀長(zhǎng)
測(cè)序效率也稱為“通量”,是指單臺(tái)設(shè)備一次反應(yīng)所獲取的序列數(shù)據(jù)量。測(cè)序儀的測(cè)序原理是將目標(biāo)DNA大量復(fù)制,然后用酶將這些DNA長(zhǎng)鏈切斷,分別對(duì)每一小段測(cè)序,最后根據(jù)片段首尾重合的部分,拼接還原成完整的長(zhǎng)鏈。讀長(zhǎng)就是指測(cè)序儀能讀出的每一個(gè)DNA片段的長(zhǎng)度。
3.SBC與SBS
這兩種方法的原理相似,但具體操作有諸多不同。SBC法使用化學(xué)試劑,有較強(qiáng)的毒性,且技術(shù)復(fù)雜較難掌握,成功率不高。相比之下,SBS法使用酶試劑,具有操作簡(jiǎn)便、結(jié)果穩(wěn)定、準(zhǔn)確性高且重復(fù)性好等特點(diǎn)。且運(yùn)用SBS法的設(shè)備相對(duì)簡(jiǎn)單,可以實(shí)驗(yàn)室自制或采用通用設(shè)備,還有使用方便的標(biāo)準(zhǔn)化試劑盒,因此很快風(fēng)靡全球相關(guān)實(shí)驗(yàn)室。