91儀器信息3月12日,中國科學院北京生命科學研究院研究員趙方慶團隊在Nature Biotechnology上發(fā)表了題為Comprehensive profiling of circular RNAs with nanopore sequencing and CIRI-long的論文,研究內容為高效測定環(huán)形RNA全長轉錄本的實驗和計算方法。該研究主要是利用隨機引物對環(huán)形RNA進行的滾環(huán)反轉錄擴增,而后應用納米孔測序技術對環(huán)形RNA的全長序列進行直接測序,并使用開發(fā)的CIRI-long算法識別長測序讀段中的環(huán)形RNA序列并進行全長重構。實驗結果表明,與傳統(tǒng)的環(huán)形RNA二代測序技術相比,該方法將環(huán)形RNA檢測靈敏度提升了20倍,并可實現對不同長度(<100bp-5kb)的環(huán)形RNA全長序列的無偏識別,大幅提升了環(huán)形轉錄本的重構能力,為其功能研究提供了重要的實驗方法和計算工具。
環(huán)形RNA是一類在真核生物中廣泛存在的具有特殊環(huán)狀結構的RNA分子。研究表明,在生物體內,環(huán)形RNA主要通過其序列特征,發(fā)揮miRNA海綿、RBP海綿及翻譯短肽等重要的生物學功能。因而環(huán)形RNA的全長序列確定是進行環(huán)形RNA功能研究的重要基礎。由于環(huán)形RNA的內部序列與線性mRNA分子高度相似,在數據中很難區(qū)分來自環(huán)形RNA和線性RNA分子的讀段。研究方法對于環(huán)形RNA結構的識別能力主要被二代測序的讀長所限制,對于長度較長(>500bp)的環(huán)形RNA分子,仍缺少有效的全長重構手段。
針對這一問題,研究團隊構建并優(yōu)化環(huán)形RNA建庫流程,使用隨機引物對環(huán)形RNA進行滾環(huán)反轉錄擴增,結合片段長度篩選(~1kb),針對長度更長的目標cDNA片段進行富集,最后使用納米孔測序技術,實現了對目標環(huán)形RNA的全長序列進行直接測定。同時,研究人員進一步開發(fā)了CIRI-long算法,識別納米孔測序數據中的環(huán)形RNA結構,并使用偏序比對算法,校正納米孔測序帶來的測序錯誤。隨后,CIRI-long基于基因注釋和剪接信號信息,提供單一樣本內和多樣本間結果的整合與校正方法,實現了環(huán)形RNA的準確識別和全長重構。
為了評估CIRI-long方法的準確性和效率,研究人員利用模擬數據和多次實驗重復,綜合評估CIRI-long結果,發(fā)現該方法具有較高的靈敏度,且與實驗結果保持了高度的一致性。同時,結合二代測序結果及公共數據庫的全面分析,表明CIRI-long可有效地對高表達環(huán)形RNA進行識別,且與二代測序方法相比,CIRI-long對環(huán)形RNA的檢測效率有著近20倍的提升,對表達豐度較低的環(huán)形RNA有著更好的識別效果,同時可以識別到長度更長的環(huán)形RNA分子,大幅提升了環(huán)形RNA全長的檢測能力。
利用該方法,研究進一步發(fā)現了一類由內含子自連形成的新型環(huán)形RNA分子(Intronic self-ligated circRNA)。這類環(huán)形RNA具有特殊的剪接位點內側的GT-AG信號和較高的兩側序列保守性,在之前工作中缺乏普遍研究。此外,研究人員在小鼠不同組織中,對內含子自連型環(huán)形RNA的表達模式開展了進一步探究,發(fā)現Tpm1基因可以產生一個長度為767bp的內含子自連型環(huán)形RNA——circTpm1。與Tpm1基因的其他內含子相比,該分子成環(huán)區(qū)域具有相對較高的保守性,且與線性mRNA在組織間具有不同的表達模式,說明circTpm1并非其母本基因轉錄的副產物,可能具有一定的生物學功能。
綜上,研究人員開發(fā)了基于納米孔測序技術的環(huán)形RNA全長識別流程CIRI-long,通過結合滾環(huán)反轉錄擴增和納米孔長讀長測序技術,可直接測定環(huán)形RNA的全長序列,實現了對環(huán)形RNA的高靈敏度檢測和內部結構重構。與傳統(tǒng)的二代測序方法相比,CIRI-long大幅提升了環(huán)形RNA全長重構能力,并可實現與二代測序相近的分析成本。同時,CIRI-long提供了樣本間整合分析的工具,并針對納米孔測序的高錯誤率建立了有效校正方法,為環(huán)形RNA的功能研究提供了重要的方法學工具,具有很高的應用價值。
該研究工作由趙方慶團隊完成,獲得國家杰出青年科學基金、國家重點研發(fā)計劃及中科院的支持。趙方慶團隊在前期的工作中建立了環(huán)形RNA識別、可變剪接檢測及定量等方法,相關研究發(fā)表在Nature Biotechnology(2021)、Nature Communications(2016,2020)、Genome Biology(2015,2020)、Briefings in Bioinformatics(2018)、Trends in Genetics(2018)、Genome Medicine(2019)、Cell Reports(2019)和Bioinformatics(2020)上。這些研究成果豐富了我們對環(huán)形RNA的組成及結構的認識,為深入了解這一類特殊的RNA分子提供了重要工具和數據支持。
環(huán)形RNA是一類在真核生物中廣泛存在的具有特殊環(huán)狀結構的RNA分子。研究表明,在生物體內,環(huán)形RNA主要通過其序列特征,發(fā)揮miRNA海綿、RBP海綿及翻譯短肽等重要的生物學功能。因而環(huán)形RNA的全長序列確定是進行環(huán)形RNA功能研究的重要基礎。由于環(huán)形RNA的內部序列與線性mRNA分子高度相似,在數據中很難區(qū)分來自環(huán)形RNA和線性RNA分子的讀段。研究方法對于環(huán)形RNA結構的識別能力主要被二代測序的讀長所限制,對于長度較長(>500bp)的環(huán)形RNA分子,仍缺少有效的全長重構手段。
針對這一問題,研究團隊構建并優(yōu)化環(huán)形RNA建庫流程,使用隨機引物對環(huán)形RNA進行滾環(huán)反轉錄擴增,結合片段長度篩選(~1kb),針對長度更長的目標cDNA片段進行富集,最后使用納米孔測序技術,實現了對目標環(huán)形RNA的全長序列進行直接測定。同時,研究人員進一步開發(fā)了CIRI-long算法,識別納米孔測序數據中的環(huán)形RNA結構,并使用偏序比對算法,校正納米孔測序帶來的測序錯誤。隨后,CIRI-long基于基因注釋和剪接信號信息,提供單一樣本內和多樣本間結果的整合與校正方法,實現了環(huán)形RNA的準確識別和全長重構。
為了評估CIRI-long方法的準確性和效率,研究人員利用模擬數據和多次實驗重復,綜合評估CIRI-long結果,發(fā)現該方法具有較高的靈敏度,且與實驗結果保持了高度的一致性。同時,結合二代測序結果及公共數據庫的全面分析,表明CIRI-long可有效地對高表達環(huán)形RNA進行識別,且與二代測序方法相比,CIRI-long對環(huán)形RNA的檢測效率有著近20倍的提升,對表達豐度較低的環(huán)形RNA有著更好的識別效果,同時可以識別到長度更長的環(huán)形RNA分子,大幅提升了環(huán)形RNA全長的檢測能力。
利用該方法,研究進一步發(fā)現了一類由內含子自連形成的新型環(huán)形RNA分子(Intronic self-ligated circRNA)。這類環(huán)形RNA具有特殊的剪接位點內側的GT-AG信號和較高的兩側序列保守性,在之前工作中缺乏普遍研究。此外,研究人員在小鼠不同組織中,對內含子自連型環(huán)形RNA的表達模式開展了進一步探究,發(fā)現Tpm1基因可以產生一個長度為767bp的內含子自連型環(huán)形RNA——circTpm1。與Tpm1基因的其他內含子相比,該分子成環(huán)區(qū)域具有相對較高的保守性,且與線性mRNA在組織間具有不同的表達模式,說明circTpm1并非其母本基因轉錄的副產物,可能具有一定的生物學功能。
綜上,研究人員開發(fā)了基于納米孔測序技術的環(huán)形RNA全長識別流程CIRI-long,通過結合滾環(huán)反轉錄擴增和納米孔長讀長測序技術,可直接測定環(huán)形RNA的全長序列,實現了對環(huán)形RNA的高靈敏度檢測和內部結構重構。與傳統(tǒng)的二代測序方法相比,CIRI-long大幅提升了環(huán)形RNA全長重構能力,并可實現與二代測序相近的分析成本。同時,CIRI-long提供了樣本間整合分析的工具,并針對納米孔測序的高錯誤率建立了有效校正方法,為環(huán)形RNA的功能研究提供了重要的方法學工具,具有很高的應用價值。
該研究工作由趙方慶團隊完成,獲得國家杰出青年科學基金、國家重點研發(fā)計劃及中科院的支持。趙方慶團隊在前期的工作中建立了環(huán)形RNA識別、可變剪接檢測及定量等方法,相關研究發(fā)表在Nature Biotechnology(2021)、Nature Communications(2016,2020)、Genome Biology(2015,2020)、Briefings in Bioinformatics(2018)、Trends in Genetics(2018)、Genome Medicine(2019)、Cell Reports(2019)和Bioinformatics(2020)上。這些研究成果豐富了我們對環(huán)形RNA的組成及結構的認識,為深入了解這一類特殊的RNA分子提供了重要工具和數據支持。