發(fā)布日期:2018-01-02
高通量測(cè)序的產(chǎn)量讓人驚嘆不已,但讀長(zhǎng)卻屢屢遭人詬病。不過(guò),從100 bp到1 kb,讀長(zhǎng)始終在進(jìn)步。近日,測(cè)序界傳來(lái)了一個(gè)激動(dòng)人心的消息,澳大利亞Garvan研究所的研究人員利用Oxford Nanopore測(cè)序技術(shù)實(shí)現(xiàn)了> 1 Mb的讀長(zhǎng),這堪稱測(cè)序歷史上的一個(gè)里程碑。
Kinghorn臨床基因組學(xué)中心的Martin Smith博士在Twitter上宣布了這一消息。在他的帶領(lǐng)下,研究團(tuán)隊(duì)首次對(duì)長(zhǎng)度超過(guò)1 Mb的DNA片段進(jìn)行了測(cè)序,此片段來(lái)自19號(hào)染色體,長(zhǎng)度為1.015 Mb。
有人形象地描繪了這個(gè)測(cè)序過(guò)程:如果將納米孔比作你的拳頭大小,那么通過(guò)納米孔的1 Mb DNA鏈就相當(dāng)于3.2 公里。哇,幾乎相當(dāng)于跑了一個(gè)迷你馬拉松啊。
傳統(tǒng)的短讀長(zhǎng)測(cè)序技術(shù)提供的數(shù)據(jù)難以組裝成完整的基因組或數(shù)據(jù)集,這就像1000塊的拼圖,拼裝起來(lái)極具挑戰(zhàn)性。嚴(yán)格來(lái)說(shuō),納米孔測(cè)序技術(shù)沒(méi)有讀長(zhǎng)的概念,因?yàn)樗軌驅(qū)⒁粭lDNA片段從頭測(cè)到尾。不過(guò),受制于樣本制備,研究人員大多測(cè)序10 kb至100 kb的片段。
在測(cè)序1 Mb的片段時(shí),Smith博士無(wú)疑遇到了不少挑戰(zhàn),但DNA提取和樣本制備是最困難的一步。即使是簡(jiǎn)單的移液,長(zhǎng)度超過(guò)100 kb的DNA分子也可能被剪切。高分子量DNA樣本會(huì)形成一大塊凝膠樣物質(zhì),而不再是液體,因此測(cè)量濃度也很困難。另外,數(shù)據(jù)分析也是挑戰(zhàn),因?yàn)榇蠖鄶?shù)軟件工具都是為短讀長(zhǎng)而開(kāi)發(fā)的。
不過(guò),在克服了重重挑戰(zhàn)之后,研究人員最終完成了超長(zhǎng)DNA片段的測(cè)序。他們表示,讀取的質(zhì)量并沒(méi)有因超長(zhǎng)而受到影響。未修正的序列與人類參考序列有90%是相同的。需要特別指出的是,天然的DNA分子包含甲基化的核苷酸,這在將原始電子信號(hào)轉(zhuǎn)換為核苷酸序列的過(guò)程中沒(méi)有考慮進(jìn)去,因此可能導(dǎo)致錯(cuò)誤的堿基檢出。
現(xiàn)在,有了這些超長(zhǎng)的序列,人們能夠更輕松地組裝基因組,解析那些復(fù)雜的區(qū)域,甚至是之前無(wú)法測(cè)序的區(qū)域。Smith博士認(rèn)為,納米孔測(cè)序在本質(zhì)上與光學(xué)測(cè)序不同,更易獲得,也更有趣。當(dāng)然,他認(rèn)為其他類型的測(cè)序仍將發(fā)揮很大的作用,各種技術(shù)可以相得益彰,需要結(jié)合使用。
Smith博士領(lǐng)導(dǎo)的研究團(tuán)隊(duì)專注于評(píng)估各種新興技術(shù),包括單細(xì)胞測(cè)序、表觀遺傳學(xué)和宏基因組學(xué)。此次測(cè)序1 Mb的DNA片段也是為了解析與癌癥相關(guān)的neochromosome(畸形染色體)的序列和結(jié)構(gòu),它包括幾百個(gè)DNA片段拼接起來(lái)的異?;蚪M序列。未來(lái),他認(rèn)為更長(zhǎng)片段(如2 Mb)的測(cè)序也將指日可待。
來(lái)源:生物通