亚洲欧美日本韩国_久久久久亚洲AV片无码V_亚洲AV片不卡无码一_H漫全彩纯肉无码网站

 
 
當(dāng)前位置: 首頁 » 新聞資訊 » 最新資訊 » 正文

綜述:高通量測序技術(shù)的原理及各平臺優(yōu)勢和實(shí)踐應(yīng)用的分析

分享到:
放大字體  縮小字體    發(fā)布日期:2019-08-31  來源:儀器信息網(wǎng)  作者:Mr liao  瀏覽次數(shù):635
核心提示:隨著人類基因組計(jì)劃(human genome project )在2003年順利完成,基因組測序技術(shù)取得了長足的進(jìn)步,這直接導(dǎo)致了每兆基因組成本的大幅下降以及檢測的基因組數(shù)量越來越多。人們對基因組的復(fù)雜性深感震驚,這也引導(dǎo)著測序技術(shù)的進(jìn)一步發(fā)展。最近的一些突破性技術(shù)使得測序技術(shù)在更短的時間內(nèi)可以獲得更多的數(shù)據(jù)量。與之對應(yīng)的是,還有一些技術(shù)的進(jìn)步使得單條序列的測序讀長變得更長――這對解析結(jié)構(gòu)性的復(fù)合區(qū)段是極其必要的。這些進(jìn)展給科研人員以及醫(yī)療診斷人員提供了一個絕佳的平臺使得人們對基因組變異導(dǎo)致的表型變化以及
隨著人類基因組計(jì)劃(human genome project )在2003年順利完成,基因組測序技術(shù)取得了長足的進(jìn)步,這直接導(dǎo)致了每兆基因組成本的大幅下降以及檢測的基因組數(shù)量越來越多。人們對基因組的復(fù)雜性深感震驚,這也引導(dǎo)著測序技術(shù)的進(jìn)一步發(fā)展。最近的一些突破性技術(shù)使得測序技術(shù)在更短的時間內(nèi)可以獲得更多的數(shù)據(jù)量。與之對應(yīng)的是,還有一些技術(shù)的進(jìn)步使得單條序列的測序讀長變得更長――這對解析結(jié)構(gòu)性的復(fù)合區(qū)段是極其必要的。這些進(jìn)展給科研人員以及醫(yī)療診斷人員提供了一個絕佳的平臺使得人們對基因組變異導(dǎo)致的表型變化以及疾病發(fā)生有了進(jìn)一步的了解。

近日,美國冷泉港實(shí)驗(yàn)室聯(lián)合加州大學(xué)戴維斯分校的研究人員在國際著名評論型綜述雜志Nature Reviews Genetics(影響因子41)上發(fā)表了一篇評論型綜述。該綜述對高通量測序的技術(shù)原理以及各平臺的優(yōu)勢比較和實(shí)踐應(yīng)用進(jìn)行了深入淺出的分析。



介紹
自從DNA的雙螺旋結(jié)構(gòu)被人們解析開始1,人們在探究健康與疾病的基因組的復(fù)雜性與差異性上做出了巨大的努力。為了支持人類基因組計(jì)劃的順利進(jìn)行2,人們在儀器和試劑上做出了巨大的改進(jìn)。該計(jì)劃的完成使得人們強(qiáng)烈的意識到人們需要更多更好的技術(shù)與數(shù)據(jù)分析能力來回答隨之而來的一系列生物學(xué)問題。然而,通量的限制以及居高不下的測序成本成為了人們進(jìn)一步了解基因組的一道坎。2000年之后推出的高通量測序平臺很好地解決了這個問題,人類基因組測序的成本直接因此下降50000倍,并且由此產(chǎn)生了一個新的名詞:下一代測序(next-generation sequencing,NGS)3。在過去的十年中,NGS技術(shù)不停的在進(jìn)步――測序的數(shù)據(jù)量增加了100-1000倍4。這些技術(shù)上的進(jìn)展使得人們甚至可以在一條read上讀出整條基因組序列。根據(jù)Veritas Genomics的數(shù)據(jù)5,人類基因組測序的成本也已經(jīng)下降到1000美元/人。不僅如此,該技術(shù)已經(jīng)廣泛在臨床診斷上得到應(yīng)用3,6。

但是,盡管NGS技術(shù)非常重要,卻并非完美。與NGS技術(shù)一道出現(xiàn)的是該技術(shù)帶來的一系列問題。NGS可以提供海量的數(shù)據(jù)量,但是其質(zhì)量卻有待提高(有報(bào)道,NGS在序列拼接過程中,錯誤率在0.1-15%范圍內(nèi)),并且NGS的序列讀長普遍較低(每條read的長度在35-700bp之內(nèi)7,這比普通的Sanger測序要短),這意味著需要更嚴(yán)格復(fù)雜的序列拼接。盡管長讀長測序可以克服NGS的這一大弱點(diǎn),但相對而言,成本較高并且通量較低,這也限制了該技術(shù)的進(jìn)一步應(yīng)用。最后,NGS同時還和其他的技術(shù)之間存在著競爭的關(guān)系。

短讀長(read)的NGS測序

測序模版克隆法生成綜述
短讀長測序方法包含兩種:邊連接邊測序(sequencing by ligation, SBL)以及邊合成邊測序(sequencing by synthesis, SBS)。在SBL方法中,帶有熒光基團(tuán)的探針與DNA片段雜交并且與臨近的寡核糖核酸連接從而得以成像。人們通過熒光基團(tuán)的發(fā)射波長來判斷堿基或者其互補(bǔ)堿基的序列。SBS方法通常使用聚合酶,而且,諸如熒光基團(tuán)在鏈的延伸過程中被插入其中。絕大多數(shù)的SBL和SBS方法,DNA都是在一個固體的表面上被克隆。一個特定區(qū)域內(nèi)成千上萬個拷貝的DNA分子可以增加信號和背景信號的區(qū)分度。大量的平行同樣對上百萬的reads的讀取大有幫助,每個平行只有唯一的DNA模板。一個測序平臺可以同時從上百萬的類似反應(yīng)中讀取數(shù)據(jù),因此可以同時對上百萬的DNA分子進(jìn)行測序。

產(chǎn)生模板的克隆有幾個方法:基于磁珠(bead-based),固相介質(zhì)(solid-state)以及DNA微球技術(shù)(DNA nanoball)(圖1)。DNA模板產(chǎn)生的第一步就是樣本DNA的片段化,接著是連接到一個為了克隆和測序而設(shè)計(jì)的接頭上。在磁珠法的準(zhǔn)備過程中,一個接頭和寡核糖核酸片段互補(bǔ)并且固定在珠子上(圖1a)。DNA模板通過使用油包水PCR(emulsion PCR,emPCR)8得以擴(kuò)增。單個珠子上被克隆得到的DNA片段可以達(dá)到上百萬個9。這些珠子可以被分為glass surface10或者PicoTiterPlate(羅氏診斷)11。固相介質(zhì)擴(kuò)增12避免了油包水PCR,取而代之的是在固相介質(zhì)上直接進(jìn)行PCR13(圖1b,c)。該方法中,正向和反向引物結(jié)合在芯片的表面,這些引物給單鏈DNA(single-stranded DNA,ssDNA)提供了末端的互補(bǔ)序列供其結(jié)合。最近,幾個NGS的平臺都是用了模塊化的flow cells。

BGI使用的Complete Genomics technology測序技術(shù)是唯一一個在溶液中完成模板富集的技術(shù)。在這種情況下,DNA被多次連接,成環(huán)以及剪切從而為了產(chǎn)生一個包含4個不同接頭的環(huán)狀的模板。通過旋轉(zhuǎn)環(huán)狀擴(kuò)增(rolling circle amplification,RCA),可以最多產(chǎn)生超過200億的DNA微球(圖1d)。微球混合物隨后被分配到芯片表面上,使得每個微球可以占據(jù)芯片的一個位點(diǎn)14。


圖1:模板擴(kuò)增策略。


邊連接邊測序(SOLiD和Complete Genomics)
從根本上來說,SBL法包含了雜交和對標(biāo)記的探針的連接15。探針包含了一到兩個特定堿基序列和一系列通用序列,這可以使得探針與模板之間進(jìn)行互補(bǔ)配對。錨定的片段則包含一段已知的和接頭互補(bǔ)的序列用于提供連接位點(diǎn)。連接之后,模板被系統(tǒng)進(jìn)行測序反應(yīng)16。在錨和探針復(fù)合物或者熒光基團(tuán)被完全移除之后,也或者連接位點(diǎn)重新生成之后,新的循環(huán)又重新開始了。

SOLiD平臺使用的是雙堿基編碼的探針,每個熒光基團(tuán)信號代表了一個二核糖核酸17。因此,原始輸出的數(shù)據(jù)并非直接和已知的核糖核酸相連。因?yàn)橛?6種可能的二核糖核酸組合并不能單獨(dú)結(jié)合熒光基團(tuán)。每四種組合使用一種熒光信號,共有四種熒光信號。所以,每種連接信號代表了幾種可能的二核糖核酸組合。SOLiD測序過程由一系列的探針-錨的結(jié)合,連接,圖像獲取以及切割的循環(huán)組成。

Complete Genomics使用探針-錨的連接方式(cPAL)或者探針-錨的合成方式(cPAS)來進(jìn)行測序14。在cPAL中(圖2b),錨的序列(與四種接頭序列其中之一的互補(bǔ))以及探針雜交到DNA微球的不同位置。每個循環(huán)中,雜交探針是一組特定位置已知堿基序列的探針的一員。每個探針包涵一段已知序列的堿基以及對應(yīng)的熒光基團(tuán)。獲取圖像之后,全部的探針-錨復(fù)合物被移除,新的探針-錨復(fù)合物被雜交。cPAS方法是cPAL的修改版,增加了read的長度;然而,目前來說,該方法還是有局限性的。


圖2: SBL測序原理。


邊合成邊測序(Sequencing-by-synthesis)
SBS的方法是指那些依賴于大量的DNA聚合酶來進(jìn)行測序的方法。但是,SBS中依然包括了各種不同的測序原理。本文中,SBS方法被分為循環(huán)可逆終止(Cyclic reversible termination, CRT)以及單核糖核酸增加(single-nucleotide addition, SNA)18。

邊合成邊測序:CRT(Illumina,Qiagen)
CRT方法是根據(jù)類似于Sanger測序的終止反應(yīng)來界定的,其3'-OH基團(tuán)被屏蔽而被阻止繼續(xù)延伸19,20。在反應(yīng)開始時,DNA模板被一段和探針序列互補(bǔ)的接頭結(jié)合,DNA聚合酶也是從這段序列開始結(jié)合。每個循環(huán)過程中,四種單獨(dú)標(biāo)記的復(fù)合物和3'屏蔽的脫氧核糖核酸被添加進(jìn)反應(yīng)中。在延伸過程中每結(jié)合一個dNTP,其他沒有被結(jié)合的dNTPs被移除,并且獲取圖像來確定是那個堿基在某個簇中被結(jié)合。熒光基團(tuán)以及屏蔽基團(tuán)隨后被移除并且開始一輪新的反應(yīng)。

Illumina的CRT和其他平臺相比,代表了最大的測序平臺市場。Illumina短讀長測序的設(shè)備可以從臺式的低通量單位到大型的超高通量,如應(yīng)用于全基因組關(guān)聯(lián)分析(whole-genome sequencing,WGS)。dNTPs是通過兩個或者四個激光通道來對熒光進(jìn)行分析的。在絕大多數(shù)Illumina平臺上,每種dNTP結(jié)合一種熒光基團(tuán),因此需要四種不同的激光通道。而NextSeq和Mini-Seq則使用的是雙熒光基團(tuán)系統(tǒng)。


圖3: SBS測序原理。

2012年,Qiagen獲得了Intelligent BioSystems CRT平臺,并且在2015年將該平臺命名為GeneReader重新推出并且使之商業(yè)化22(圖3b)。與其他平臺不同的是,該平臺打算做一站式的NGS平臺,從樣本制備到數(shù)據(jù)分析,全部一站式解決。為此,GeneReader系統(tǒng)整合了QIAcube樣本制備系統(tǒng)和Qiagen Clinical Insight平臺用于不同的數(shù)據(jù)分析。GeneReader平臺的技術(shù)原理與Illumina平臺基本一致。然而,該平臺并非讓每個DNA模板都去結(jié)合帶有熒光基團(tuán)的dNTPs23,而是只要足夠的dNTPs結(jié)合到模板上就可以完成鑒定。


邊合成邊測序:SNA(454,Ion Torrent)
與CRT不同的是,SNA方法依賴于單信號標(biāo)記dNTP來對鏈進(jìn)行延伸。四種核糖核酸都必須反復(fù)添加到測序反應(yīng)過程中。不僅如此,SNA不需要將dNTP屏蔽,因?yàn)闇y序反應(yīng)過程中下一個堿基的缺失會阻止鏈的延伸。堿基的寡聚體則是一個例外,在這種情況下,信號的強(qiáng)度會隨著dNTP數(shù)量的增加而成比例的增強(qiáng)。

第一個NGS儀器是454焦磷酸測序儀24。這種SNA系統(tǒng)將結(jié)合有模板的珠子以及酶混合物分配到PicoTiterPlate中。由于一個dNTP只能結(jié)合到一條鏈上,酶復(fù)合物會對其產(chǎn)生生物熒光。一個特定的珠子中的一個或多個dNTPs可以通過電荷共軛偶聯(lián)設(shè)備(charge-coupled device, CCD)檢測到的熒光來確認(rèn)(圖4a)。

Ion Torrent是第一個沒有光學(xué)感應(yīng)的NGS平臺25。與酶化學(xué)復(fù)合物產(chǎn)生的信號相比,Ion Torrent平臺檢測的是dNTP中釋放出來的H離子。pH值的改變通過(integrated complementary metal-oxide-semiconductor,CMOS)以及(ion-sensitive field-effect transistor,ISFET)來檢測(圖4b)。傳感器對pH的變化對于連續(xù)堿基的檢測還不夠完善,因此在測量同一堿基連續(xù)出現(xiàn)時的數(shù)量可能會有所誤差。


圖4: 邊合成邊測序:單核糖核酸添加法。



短讀長平臺的比較
每個平臺在通量,成本,錯誤率以及read結(jié)構(gòu)上都大相徑庭(表一)。盡管有多家NGS技術(shù)供應(yīng)商,NGS研究最常用的還是Illumina平臺21。盡管該平臺極為穩(wěn)定,數(shù)據(jù)可靠,但是基于其使用的單一測序的方法26-28,既然具有系統(tǒng)偏好性的問題。因此,新技術(shù)的發(fā)展使得研究人員能夠有完整的測序方案來獲得完整的序列信息。

SOLiD與Complete Genomics系統(tǒng)使用的SBL技術(shù)準(zhǔn)確率非常高(~99.999%)7,14,因?yàn)槊總€堿基都會被標(biāo)記多次。雖然這些技術(shù)非常準(zhǔn)確,但是在敏感性與特異性之間依然不能達(dá)到完美的平衡,當(dāng)一些錯誤的堿基變化出現(xiàn)時,真實(shí)的堿基變化可能被忽略29-31。該類技術(shù)在應(yīng)用上最大的限制可能就是其過短的讀長。盡管所有的平臺都能產(chǎn)生單末端和雙末端的reads,SOLiD的最大讀長只能達(dá)到75bp,Complete Genomics只能達(dá)到28-100bp33,使得其在基因組拼接和結(jié)構(gòu)變異研究中的可操作性大大降低。不幸的是,SOLiD系統(tǒng)不僅受制于運(yùn)行時間,還受制于其工業(yè)生產(chǎn)。另外,盡管cPAL計(jì)劃準(zhǔn)備在成本和通量上和Illumina競爭,卻在2016年被迫下馬,該技術(shù)僅在人類WGS中有所應(yīng)用33,34。cPAS的BGISEQ-500系統(tǒng)則受制于中國大陸政府。

Illumina由于其技術(shù)成熟,平臺之間高度互補(bǔ)性與交叉性,使得其在短讀長測序上大占優(yōu)勢。Illumina的產(chǎn)品覆蓋了從低通量的Mini-Seq到超高通量的HiSeq X系列,其中HiSeq X系列最多可以在一年內(nèi)產(chǎn)生1800多個30×覆蓋度的人類基因組數(shù)據(jù)量。此外,其運(yùn)行時間,read結(jié)構(gòu)以及read長度(最大300bp)都在不停的改進(jìn)。但是,作為一個依賴于CRT技術(shù)的Illumina平臺,相對于SNA平臺的優(yōu)勢在于其在讀取核糖核酸多聚體(同一種核糖核酸多次出現(xiàn))時較低的錯誤率。盡管SNA平臺總體上的準(zhǔn)確率可以達(dá)到99.5%35,但是在讀取那些高AT富集或者高GC富集的片段的時候錯誤率差強(qiáng)人意32,37,38。在2008年,據(jù)Bentley等報(bào)道,Illumina平臺鑒定到的人類單核糖核酸多態(tài)性(SNPs)與基因芯片鑒定的SNPs具有驚人的一致性35。但是,這種高度的敏感性也隨之帶來了2.5%左右的錯誤率。因此,其他小組計(jì)劃使用Sanger測序來對鑒定到的SNPs進(jìn)行重新測序以便區(qū)分測序錯誤導(dǎo)致的SNPs與真實(shí)的基因突變導(dǎo)致的

SNPs35,39,40。在對所有的可能性都進(jìn)行優(yōu)化之后,Illumina平臺被大量的研究人員認(rèn)可,在大量的領(lǐng)域中均有涉及:WGS的基因組測序與外顯子測序;遺傳學(xué)應(yīng)用如染色質(zhì)免疫共沉淀――測序(chromatin immunoprecipitation followed by sequencing)41;ATAC-Seq(transposase-accessible chromatin using sequencing)42或者DNA甲基化測序(Methyl-Seq)43;RNA轉(zhuǎn)錄組測序(transcriptomics applications through RNA sequencing, RNA-seq)44等等。NextSeq與MiniDeq平臺使用的雙色標(biāo)記系統(tǒng)通過降低雙色通道的掃描與熒光基團(tuán)的使用達(dá)到成本并且增加測序速度。然而,雙通道系統(tǒng)卻會略微增加測序的錯誤率45。HiSeq X是目前最高通量的儀器,但其由于通量過大,因此只在部分應(yīng)用上得以使用,如WGS與全基因組甲基化測序。不僅如此,HiSeq X更大的局限在于其高昂的成本,以至于超過了絕大多數(shù)單位的可接受程度。

Qiagen的GeneReader是專為臨床診斷設(shè)計(jì)的,其主要關(guān)注點(diǎn)在腫瘤基因panels46上,也因此其局限性較大。根據(jù)對其運(yùn)行時間與功能的分析,GeneReader與Illumina的MiSeq較為相似46。盡管還沒有使用數(shù)據(jù),但是GeneReader和MiSeq平臺有相同的優(yōu)缺點(diǎn)。

454平臺和Ion Torrent平臺相比于其他的短讀長平臺而言,能夠提供較長的read讀長,分別大約在700bp與400bp,因此在基因組結(jié)構(gòu)較為復(fù)雜的研究上應(yīng)用較多。然而,由于同樣都是基于SNA技術(shù),它們都擁有相同的缺點(diǎn)。雖然,其在非堿基多聚體(non-homopolymer)的測序上正確率與其它NGS平臺相差無幾,但其插入與缺失(Insertion and deletion,indel)是最大的問題。同一堿基的多聚體是該類技術(shù)最大的問題所在。有報(bào)道,對同一堿基的多聚體的測序誤差能夠達(dá)到6-8個堿基之多47,48。不幸的是,盡管Ion Torrent依然在緊跟快速進(jìn)化的NGS平臺的步伐,454平臺卻由于成本與應(yīng)用范圍過于狹小卻已經(jīng)被羅氏公司停產(chǎn)。

Ion Torrent平臺為不同的研究人員的不同需求提供了不同的芯片與設(shè)備,通量從50Mb到15Gb不等,運(yùn)行時間也從2小時到7小時不等。這一點(diǎn)使得其幾乎是所有目前的二代測序平臺中最快的一個。這也使得其在基因panel與精準(zhǔn)臨床診斷上大有優(yōu)勢50,包括轉(zhuǎn)錄組與可變剪切鑒定51。Ion Torrent先后發(fā)布Ion Personal Genome Machine (PGM) Dx與Ion S5系列希望于在臨床診斷上打開疆土。與Ion Chef文庫制備試劑盒和芯片上樣設(shè)備結(jié)合使用,S5系列希望能夠成為最方便操作的設(shè)備,消除其它Ion Torrent設(shè)備對氬的依賴。但是,其最大的缺點(diǎn)在于Ion PGM Dx系統(tǒng)可以進(jìn)行雙向測序,更高通量的Ion Proton與S5系統(tǒng)卻并不支持雙向測序,也因此限制了其在大范圍基因組測序與轉(zhuǎn)錄組結(jié)構(gòu)上的應(yīng)用。

長讀長(read)的NGS測序
綜述

基因組是一個復(fù)雜的復(fù)合物,其中包含了多種重復(fù)序列,拷貝數(shù)變化,結(jié)構(gòu)變異。這些與進(jìn)化,適應(yīng)以及疾病密切相關(guān)54-56。然而,許多復(fù)合物元件由于過長,導(dǎo)致短讀長測序并不能夠完美的對其進(jìn)行測序。長讀長測序的reads可以達(dá)到幾千個堿基,這使得可以對大的結(jié)構(gòu)進(jìn)行功能解析。此類的長讀長測序產(chǎn)生的單一長序列可以跨越復(fù)合物或者重復(fù)序列。長讀長測序在轉(zhuǎn)錄組測序過程中也大有益處,因?yàn)殚L讀長的reads可以跨越完整的mRNA的轉(zhuǎn)錄本而不需要拼接。這可以使得研究人員可以鑒定到更多的基因亞型等。

最近,人們開發(fā)出了兩種長讀長測序的實(shí)驗(yàn)方案,分別是:單分子實(shí)時測序(single-molecule real-time sequencing )以及依賴于已有短讀長技術(shù)體外構(gòu)建長讀長的合成法。單分子法與短讀長測序完全不同,因?yàn)閱畏肿臃ú恍枰獙δ0暹M(jìn)行擴(kuò)增來產(chǎn)生足夠測序儀讀取的信號,也不需要輪番添加dNTP。而合成法并非產(chǎn)生原始的長讀長的reads,而是通過利用barcodes來進(jìn)行拼接獲得長片段。

表一:NGS平臺概述。





單分子長讀長測序(PacBio和ONT)
最近這段時間,最常用的長讀長測序法平臺就是使用PacBio Biosciences(PacBio)57的單分子實(shí)時測序法(single-molecule real-time sequencing, SMRT)(圖5a)。該設(shè)備使用了一個特制的流動單元,其中包含了成千上萬的單獨(dú)的底部透明的皮升孔(picolitre wells)――zero-mode waveguides(ZMW)58。短讀長SBS技術(shù)需要使得聚合酶結(jié)合DNA,沿著DNA進(jìn)行擴(kuò)增,而PacBio則固定聚合酶在空的底部,讓DNA鏈通過ZMW。由于有聚合酶有固定的位置,因此該系統(tǒng)可以對單分子DNA進(jìn)行測序。dNTP結(jié)合在每個孔的單分子模板上,通過激光或者成像設(shè)備記錄ZMW底部標(biāo)記在核糖核酸上的發(fā)射波長的顏色與持續(xù)時間來進(jìn)行序列的讀取。聚合酶在結(jié)合dNTPs的過程中,切割dNTP結(jié)合的熒光基團(tuán),使得熒光基團(tuán)在第二個標(biāo)記的堿基進(jìn)入ZMW前將前一個熒光基團(tuán)去除。SMRT平臺也使用了獨(dú)特的環(huán)狀模板,這種方式的模板可以使得聚合酶反復(fù)讀取模板的序列。盡管這種方法不太容易對長度大于3kb的片段反復(fù)讀取,但是短的模板卻可以反復(fù)讀取多次57,59。由于多次讀取同一序列,因此系統(tǒng)會產(chǎn)生多次測序后的保守序列(consensus sequence, CCS)。
?
2014年,第一個消費(fèi)級別的nanopore測序儀的原型機(jī)――MinION在Oxford Nanopore Technologies(ONT)誕生。與其他平臺不同的是,nanopore測序儀并不監(jiān)測模板DNA結(jié)合或雜交的核糖核酸。其它平臺通過監(jiān)測次級信號,光,顏色或pH等來進(jìn)行堿基序列的讀取,二nanopore則直接對天然的ssDNA分子進(jìn)行讀取。為達(dá)成此,DNA需要通過一個蛋白孔(protein pore)(圖5b),孔也會因?yàn)镈NA分子的通過導(dǎo)致的電壓阻塞(voltage blockade)的發(fā)生。對這些電荷瞬時的追蹤稱為squiggle space,特定DNA序列通過孔會產(chǎn)生特定的電壓改變,這被稱為k-mer。相比于1-4種可能的信號,nanopore擁有1000多種可能的k-mer,尤其是當(dāng)天然DNA序列中存在修飾的堿基的時候。最近的MK1 MinION流動單元由特殊應(yīng)用的芯片組成,包涵了512個獨(dú)立的通道,每秒可以讀取70bp長度,到2016年預(yù)計(jì)能夠增加到500bp/秒。新推出的PromethION設(shè)備是包含了48個獨(dú)立流動單元的高通量平臺。該項(xiàng)工作最多可以在2天內(nèi)輸出~2-4Tb的數(shù)據(jù)量,這使可能其成為HiSeq X系列的強(qiáng)力競爭者。與PacBio的環(huán)狀模板類似的是,ONT MinION使用一個leader-harpin library結(jié)構(gòu)。這使得正向DNA鏈可以通過孔,接著harpin蛋白結(jié)合雙鏈,最后是反義鏈。這產(chǎn)生了1D和2D reads,1D鏈可以通過比對產(chǎn)生一個保守的2D read。

圖5: 長讀長實(shí)時測序原理。



長reads的合成

與真正測序的平臺不同的是,合成長讀長技術(shù)依賴于一個barcode系統(tǒng)來結(jié)合不同的片段,通過已有的短讀長測序儀來獲得長讀長reads61。該方法將大的DNA分子分割成若干個小片段到微孔中或者乳液中。每個微孔或者乳液中的模板被切割并且加上了barcodes。這種方法允許在短讀長測序儀上使用,測序后數(shù)據(jù)被通過barcode分開按照barcodes的序列進(jìn)行拼接62。

合成法有兩個系統(tǒng):Illumina長片段合成平臺(圖5c)與10X Genomics乳液系統(tǒng)(圖5d)。Illumina系統(tǒng)(Moleculo)分割DNA到小板上而不需要特殊儀器。然而,10X Genomics乳液系統(tǒng)(GemCode與Chromium)使用乳液分隔DNA并且需要微流體平臺(microfluidic instrument)來進(jìn)行測序前的準(zhǔn)備工作。在其實(shí)濃度低至1ng的情況下,10X Genomics乳液系統(tǒng)可以任意切割長的DNA片段(最大達(dá)到100kb)到微粒(GEM)中,這種威力一般包含了≤0.3× 的基因組以及一個獨(dú)特的barcode。

單分子測序與合成法測序的比較
人們對長讀長測序越來越感興趣,每個系統(tǒng)都有其優(yōu)劣(表一)。最近長讀長測序最受歡迎的是PacBioRS II。該設(shè)備可以產(chǎn)生超過50kb長度的單個read,長鏈建庫測序平均長度為10-15kb。這種特性使得在基因組拼接與大范圍基因組結(jié)構(gòu)的應(yīng)用中大有好處63,64。但是,長鏈的單個堿基錯誤率在15%左右65,使得人們對該儀器的使用有所顧慮66。不幸的是,這些錯誤隨機(jī)分布每個reads,也因此必須有足夠高的覆蓋度來消除單個堿基錯誤率的負(fù)面影響67。

PacBio的環(huán)狀模板有時候也會出現(xiàn)錯誤。單個堿基測序次數(shù)越多,結(jié)果就越可靠,其最高準(zhǔn)確率達(dá)到99.999%59,68。其高準(zhǔn)確率與Sanger測序相似,使得該方法與Sanger測序一道成為SNPs的研究方法65。該設(shè)備的運(yùn)行時間與通量受測序讀長的影響,長的模板需要更長的時間。舉例來說,1kb的庫運(yùn)行1小時測序每個分子可以產(chǎn)生7500個堿基,平均大約重復(fù)8次;而運(yùn)行4小時每個分子可以產(chǎn)生大約30000個堿基(大約重復(fù)30次)。相反的是,10kb的庫運(yùn)行4小時產(chǎn)生30000個堿基只能重復(fù)3次左右。通量的限制以及高企的成本(1000美元/G),加上較高的覆蓋度使得PacBio RS II成為那些較小的實(shí)驗(yàn)室難以應(yīng)用的技術(shù)。然而,考慮到這些問題,PacBio推出了Sequel系統(tǒng),其通量與RS II相比高出了7倍,使得30×覆蓋度的人類基因組測序成本大幅下降一半69。

ONT MinION是一個小的(~3 cm× 10 cm)USB設(shè)備,并且可以在個人電腦上運(yùn)行,使得其成為最小的測序平臺。這使得MinION具有極高的便攜性,并且在臨床診斷中以及那些不容易到達(dá)的地方有著廣泛的應(yīng)用前景。盡管周邊設(shè)備依然只有在實(shí)驗(yàn)室中才有,如文庫準(zhǔn)備的恒溫器,這依然可以大幅減少設(shè)備空間。與其他平臺不同,MinION在片段大小上是有限制的。理論上來講,任意大小的DNA分子都可以在該設(shè)備上測序,但是實(shí)際情況是在對長片段進(jìn)行測序過程中,是有所制約的70。作為ONT技術(shù)本身的特性,ONT擁有超過1000種獨(dú)立的信號,這使得ONT擁有巨大的錯誤率――1D read大約在30%左右(主要是indel)。有效的對核糖核酸復(fù)合物的測序也是ONT MinION面臨的一大問題。當(dāng)核糖核酸復(fù)合物超過k-mer長度,就很難準(zhǔn)確鑒定前一個k-mer何時離開孔而下一個k-mer何時進(jìn)入孔。因?yàn)樾揎椀膲A基會改變原有的k-mer設(shè)定的電壓變化,所以堿基的修飾對MinION而言同樣也是一大挑戰(zhàn)。幸運(yùn)的是,最近的一系列的對試劑以及算法的改進(jìn)使得其準(zhǔn)確率提高不少71。

應(yīng)用

WGS正在成為NGS中最廣泛的應(yīng)用。通過該技術(shù)并且結(jié)合生物學(xué)應(yīng)用,研究人員可以獲得基因組信息中最值得注意的信息73。舉例來說,2012年,Ellis等報(bào)道了基因與乳腺癌患者芳香酶抑制劑(aromatase inhibitor)治療法之間的關(guān)聯(lián)。他們指出突變,后果與診斷之間的關(guān)聯(lián),同樣還有癌癥相關(guān)基因的突變的富集。這提供了一個可能性,即:乳腺癌有不同的突變造成不同的表型,具有復(fù)雜的病理學(xué)75。最近的NGS平臺的改進(jìn)使得研究人員發(fā)現(xiàn)了一些幾年前難以想象的新觀點(diǎn)與機(jī)會。在2010年,1000基因組計(jì)劃(1000 genomes project)開放了其從179個個體中獲得的WGS原始數(shù)據(jù)以及697個個體的測序數(shù)據(jù)76。到2015年,研究人員已經(jīng)構(gòu)建了26個不同人群的2504個人的基因組群體77,78。給人們從種群的角度來觀察人類的變異。但這還不是該項(xiàng)目的終點(diǎn),越來越多的人的基因組正在被得以測序79-81。種群水平的測序已經(jīng)成為人們更好的理解人類疾病的一個重要的工具,同樣也得到了意想不到的結(jié)果。一個例子是,Sidore等82對2120個撒丁島人(Sardinians)的WGS研究發(fā)現(xiàn)了一些新的和脂肪相關(guān)的基因以及炎癥的標(biāo)志物,給人們對血液膽固醇的分子機(jī)制的研究提供了新思路。

全外顯子組測序(Whole-exome and targeted sequencing)83同樣也廣泛應(yīng)用于測序的研究中。受制于基因組材料大小的局限,很更多的個人樣本可以在一個測序中實(shí)現(xiàn),增加了基因組研究的寬度以及深度。使用外顯子測序,Iossifov84等對超過2500個單一的家庭進(jìn)行測序,每個家庭都有一個小孩患有自閉癥(autism spectrum disorder, ASD)。研究人員在30%的樣本中發(fā)現(xiàn)了錯意突變(missense mutations),基因干擾的突變(gene-disrupting mutations)以及拷貝數(shù)的變異。該工作與其他的工作一道鑒定到了ASD相關(guān)的基因突變85,86。其他證據(jù)表明,高覆蓋度的WGS也可以解決復(fù)雜的變異以及臨床樣本的分析。2015年,Griffith等認(rèn)為可以使用一個完美的跨平臺的方法(包含靶向測序)來鑒定腫瘤中高可信度的SNPs。該方法中,作者認(rèn)為10000×的覆蓋度可以鑒定到稀有突變。由于10000×的覆蓋度對于WGS而言實(shí)在過高,靶向測序便在臨床中得到了廣泛的應(yīng)用。

?NGS同樣在基因的調(diào)控研究中有廣泛的應(yīng)用。蛋白-DNA互作可以通過染色質(zhì)免疫共沉淀結(jié)合NGS測序(ChIP-seq)來得以研究41。利用NGS對修飾堿基的研究也是可行的。舉例來說,甲基化測序包含了甲基化DNA的捕獲與富集88,對甲基化與非甲基化區(qū)段的選擇性消化89,90,91。但是,盡管利用此方法獲得了很多重大的發(fā)現(xiàn),修飾與捕獲過程成為其最大的限制。2010年,F(xiàn)lusberg等92發(fā)表了一個概念性的研究方法,即:使用PacBio來區(qū)分甲基化與非甲基化的堿基。由于聚合酶即便是甲基化的堿基也能夠延伸,但在甲基化位點(diǎn)上會停留更多的時間,因此這里改變的信號可以認(rèn)為含有甲基化修飾。與之相同的是,nanopore平臺也能夠監(jiān)測修飾的堿基,因?yàn)榧谆瑯訒绊戣b定到的電壓的變化。這使得甲基化的測序可以在不需要化學(xué)操作的條件下進(jìn)行93。

一個最近的NGS的范例是對長鏈DNA的測序。重復(fù)序列以及復(fù)合序列長久以來較難以拼接,短讀長測序很難解決這個問題94-96。最近,Chaisson等97對長讀長測序的使用使得其能夠在人類GRCh37數(shù)據(jù)庫中提交超過1Mb的新的序列,這些序列彌補(bǔ)甚至跨越了曾經(jīng)的溝。Chaisson等還鑒定到了大于26000個超過50bp的indels,也因此,GRCh37數(shù)據(jù)庫成為最有參考價值的幾個基因組之一。除了簡單的增加基因組數(shù)據(jù)可靠性之外,長讀長還能夠提供更有效的臨床診斷98-100。

在對轉(zhuǎn)錄水平上的研究也因?yàn)镹GS受益匪淺。今天,研究人員甚至能夠使用NGS的深度測序?qū)蝹€轉(zhuǎn)錄本進(jìn)行研究。2014年,Treutlein等101使用了組織發(fā)育過程中不同細(xì)胞類群的單細(xì)胞RNA測序發(fā)現(xiàn)了用于鑒定細(xì)胞亞群的標(biāo)志物。盡管長讀長測序相對而言在對轉(zhuǎn)錄本的定量上不占優(yōu)勢,但是,長讀長可以在研究轉(zhuǎn)錄組的結(jié)構(gòu)上有所幫助51。舉例來說,最近的人類長讀長轉(zhuǎn)錄組測序研究表明 10%的reads是新的可變剪切體102。

?NGS最新的設(shè)備――nanopore測序儀,依然在尋找其定位的過程中。然而,研究人員正在將其快速的文庫制備,實(shí)時的數(shù)據(jù)生產(chǎn)以及小的體積的優(yōu)勢轉(zhuǎn)變?yōu)橘Y本過程中。最近,英國Stanley Royd Hospital的研究人員使用MinION用于監(jiān)測沙門氏菌(Salmonella enterica)的爆發(fā)103。MinION測序儀最令人振奮的應(yīng)用可能就是2014年的埃博拉病毒爆發(fā)104。在位于日內(nèi)瓦的歐洲移動實(shí)驗(yàn)室的主持下,作者對埃博拉病毒的傳播以及進(jìn)化歷史進(jìn)行了深入的研究。

結(jié)尾
我們正處在新的NGS技術(shù)革命的頂端。NGS現(xiàn)在已經(jīng)不僅僅只是一個新奇的事物,而已經(jīng)成為了一個在生物學(xué)研究中廣泛應(yīng)用的技術(shù)。最新的超高通量測序儀已經(jīng)將曾經(jīng)認(rèn)為不可能的事情成為可能。這包含了首創(chuàng)的精準(zhǔn)醫(yī)療(medicine initiatives)以及Illumina計(jì)劃的對循環(huán)腫瘤DNA(circulating tumour DNA, ctDNA)進(jìn)行測序。每個計(jì)劃都對數(shù)萬個基因組樣本進(jìn)行測序。所以,快速以及低成本的測序給予了內(nèi)科醫(yī)生強(qiáng)大的工具來翻譯基因組信息成為有用的臨床診斷結(jié)果。

這個革命也帶來了新的挑戰(zhàn)。由于NGS旨在廣泛的應(yīng)用于臨床,時間就成為一個NGS首先需要面對的挑戰(zhàn)。對于那些嚴(yán)重的神經(jīng)性疾病或者極為危險(xiǎn)的癌癥患者而言,數(shù)周的WGS分析的等待時間足以使的患者錯過最佳的治療時間。對于急性感染而言,這些事件已經(jīng)下降到幾天。盡管人們已經(jīng)對時間做出了巨大的改進(jìn),但是絕大多數(shù)現(xiàn)有的系統(tǒng)都不能完全滿足快速模式下的足夠產(chǎn)出。

雖然臨床診斷面臨著數(shù)據(jù)量不夠的問題,NGS其他方面的應(yīng)用卻面臨著生產(chǎn)力過剩的境地。目前,已有超過14000個基因組序列上傳到US National Center for Biotechnology Information(NCBI)中。2013年,Schatz與Langmead報(bào)道了全世界每年可以生產(chǎn)超過15pb的數(shù)據(jù)量,并且數(shù)量與通量依然在繼續(xù)增加107。數(shù)據(jù)量的富余對分析以及其下游提出了嚴(yán)峻的挑戰(zhàn),這需要革命性的存儲與生信解決方案108。將海量的數(shù)據(jù)量翻譯成有生物學(xué)與遺傳學(xué)內(nèi)涵的結(jié)果同樣也是一個挑戰(zhàn)87,109,110。在臨床診斷方面,通過NGS分析的數(shù)據(jù)產(chǎn)生的假陽性或者假陰性同樣也是需要慎重考慮的問題111,112。

最近,Illumina由于NGS與其周邊產(chǎn)品獲得了巨大的成功。其它生產(chǎn)商也在快速革新自身的產(chǎn)品113。Illumina的市場仍然在增長,以至于優(yōu)勢巨大。BGISEQ-500以及Helicos technology的GenoCare114在亞洲也有所斬獲。ONT PromethION115與Illumina HiSeq X系列則向著成本與產(chǎn)量的極限大步邁進(jìn)。隨著人們對臨床診斷測序興趣的增加,已有的NGS供應(yīng)商正在提供各種快速的解決方案,如Ion Torrent S5以及Illumina的MiniSeq,還有新加入者Qiagen的GeneReader也來參與競爭。

今后的幾年里,更多的玩家也會帶著心得解決方案進(jìn)入這個市場。GenapSys (Sigma-Aldrich)的electronic ‘lunchbox’-sized sequencer116; Genia (Roche)的新的nanopore測序方案117; 以及單通道CMOS技術(shù)118,都號稱能夠在臨床應(yīng)用上節(jié)約足夠的時間。這些已有的和新的攪局者都有著科技革命的潛質(zhì),包括直接對RNA或者蛋白進(jìn)行測序等,這些最近和未來的進(jìn)步使得今天成為NGS發(fā)展的黃金時期。

參考文獻(xiàn)
1. Watson, J. D. Crick, F. H. The structure of DNA. Cold Spring Harb. Symp. Quant. Biol. 18, 123


生物芯片 生物芯片處理 試管和離心管 其他實(shí)驗(yàn)耗材 分子生物學(xué)試劑 該公司服務(wù)分類 芯片與生物信息學(xué) 轉(zhuǎn)基因 免疫與抗體 分子與細(xì)胞 其他生物研發(fā) 測序/合成 
 
關(guān)鍵詞: 堿基 基因組 平臺 序列 的是
 
打賞
[ 新聞資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 違規(guī)舉報(bào) ]  [ 關(guān)閉窗口 ]
免責(zé)聲明:
本網(wǎng)站部分內(nèi)容來源于合作媒體、企業(yè)機(jī)構(gòu)、網(wǎng)友提供和互聯(lián)網(wǎng)的公開資料等,僅供參考。本網(wǎng)站對站內(nèi)所有資訊的內(nèi)容、觀點(diǎn)保持中立,不對內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。如果有侵權(quán)等問題,請及時聯(lián)系我們,我們將在收到通知后第一時間妥善處理該部分內(nèi)容。
 

綜述:高通量測序技術(shù)的原理及各平臺優(yōu)勢和實(shí)踐應(yīng)用的分析二維碼

掃掃二維碼用手機(jī)關(guān)注本條新聞報(bào)道也可關(guān)注本站官方微信賬號:"xxxxx",每日獲得互聯(lián)網(wǎng)最前沿資訊,熱點(diǎn)產(chǎn)品深度分析!
 

 
0相關(guān)評論

 
人妻无码中文专区久久五月婷| 丰满大爆乳波霸奶| 国产精品9999久久久久仙踪林| 乱人伦视频中文字幕| 国产成人高清精品免费软件| 久久天天躁狠狠躁夜夜avapp | 色老汉免费网站免费视频| 欧美巨大另类极品videosbest| 国产午夜精品一区二区三区| 国产sp调教打屁股视频网站| 少妇高潮一区二区三区99| 欧美自拍嘿咻内射在线观看| 亚洲熟妇无码一区二区三区导航| 国产真人无遮挡作爱免费视频| 国产乱码卡二卡三卡老狼| 人妻精品久久久久中文字幕一冢本| 一本大道无码人妻精品专区| 无码a级毛片免费视频内谢5j| 国产婷婷一区二区三区| 亚洲国产成人片在线观看无码| 精品国产免费一区二区三区 | 黄色视频免费在线观看| 男人靠女人免费视频网站| 亚洲av无一区二区三区| 精品人妻一区二区三区四区| 国产极品视觉盛宴| 韩国19禁主播深夜福利视频| 中国女人内谢69xxxx免费视频| 国产三级精品三级男人的天堂| 亚洲成色www久久网站夜月| 久久亚洲国产成人精品性色| 好大好湿好硬顶到了好爽视频| 蜜臀av无码一区二区三区| 日本少妇人妻xxxxx18| 亚洲精品久久无码av片软件| 玩弄丰满奶水的女邻居| 日韩一本之道一区中文字幕| 无码国产精成人午夜视频| 久久精品亚洲中文字幕无码网站 | 少妇被粗大的猛烈进出69影院一 | 日本三级欧美三级人妇视频|