發(fā)布日期:2016-08-04
普林斯頓大學最新一項研究發(fā)現(xiàn)了一些新的與自閉癥相關的候選基因。
雖然研究人員估計存在有數(shù)百個與自閉癥相關的基因,但實際上只有一小部分有明確的實驗證據(jù)證明其與自閉癥有關。8月1日發(fā)表在自然雜志上的一項研究旨在改變這種現(xiàn)狀,他們通過使用大數(shù)據(jù)和機器學習的方法來進行一個有關泛自閉癥障礙(ASD)的全基因組預測。該研究的第一作者Arjun Krishnan告訴我們他們的結果將如何幫助泛自閉癥障礙(ASD)的早期診斷和治療。
Q:你能簡單總結下你的研究嗎?
Arjun Krishnan:泛自閉癥障礙(ASD)具有很強的遺傳基礎,預計有400-1000相關基因,但是目前只有約65種自閉癥基因被發(fā)現(xiàn)。由于泛自閉癥障礙(ASD)十分復雜,光排序或僅僅進行基因研究是相當不夠的,不足以揭示自閉癥的遺傳基礎。因此,我們決定采取一種補充數(shù)據(jù)驅動的方法來解決這一問題。我們使用的方法是基于對先前已知自閉癥基因的學習模式與人腦中特定基因網(wǎng)絡之間是如何聯(lián)系的,我們用這些模式來識別新的自閉癥基因。
最重要的結果是對基因組中自閉癥相關的基因做了一個全面的補充預測。在研究的其他部分中,利用這些基因組泛自閉癥障礙ASD候選基因和大腦網(wǎng)絡,我們已經(jīng)確定大腦發(fā)育的階段和區(qū)域,以及自閉癥患者身上可能會被破壞的特定細胞功能。我們還建立了一個交互網(wǎng)站,任何生物醫(yī)學研究人員或臨床醫(yī)生都可以訪問和查閱使用我們的研究結果。
Q:你的研究結果意義是什么?
Arjun Krishnan:我們預測了數(shù)百個“新的”候選基因,這些都是在以前的自閉癥相關遺傳研究從來沒有被確定或者涉及的。對于遺傳學家來說,這意味著他們可以使用我們的預測來直接進行測序研究,更快、更便宜的發(fā)現(xiàn)自閉癥相關基因。研究人員可以利用它們來區(qū)分和解釋有關研究ASD全基因組測序的結果。最后,生物醫(yī)學研究人員可以使用這些數(shù)據(jù)以及相關分析,全力研究新的自閉癥基因以及它的相關功能、發(fā)育和在結構上的影響。
Q:你能向我們解釋下是如何將機器學習方法應用到這項研究上嗎?
Arjun Krishnan:這項技術基本上類似于Facebook使用的“社交網(wǎng)絡”方法,人們在社會背景下是互相關聯(lián)的,F(xiàn)acebook首先通在社交網(wǎng)絡中尋找你的朋友,建議你將一位中學同學“添加為好友”,然后通過你們在社交網(wǎng)絡中的共同好友進行推薦。
我們建立了一個特定的大腦基因網(wǎng)絡,它是一個關于基因如何在大腦中依靠對方正常運轉的地圖。利用這個網(wǎng)絡,我們采用類似的理念來預測新的ASD基因——首先,我們在大腦網(wǎng)絡中發(fā)現(xiàn)與已經(jīng)ASD基因相關的同伴,然后確定網(wǎng)絡中與這些協(xié)作基因相關的其他基因。
這個設想和其他一些設想一起,形成了一個我們進行系統(tǒng)預測的機器學習框架。
Q:你們實現(xiàn)這些成果用了哪些方法?
Arjun Krishnan:我們用來做ASD基因預測的是一種機器學習方法,它能學習如何識別在基因網(wǎng)絡與其他基因關聯(lián)的自閉癥基因,然后使用這些模式來預測新的ASD基因。我們使用的基因網(wǎng)絡表明基因是如何一起在大腦中以細胞發(fā)揮作用的,或直觀地說是一副大腦分子水平的功能圖。
我們從所有可能的來源收集了與自閉癥相關的基因,包括那些有直接證據(jù)或者間接證明的,同時對每個基因的證據(jù)是否可靠進行跟蹤。然后我們建立了一個基于網(wǎng)絡證據(jù)加權疾病基因分類器,學習在大腦網(wǎng)絡中已知ASD基因的連接模式(考慮到每個基因的證據(jù)級別),然后使用數(shù)據(jù)驅動模式來預測基因組中的每一個基因潛在的與ASD的相關性。
Q:這種方式與以前的基因預測方法有什么不同呢?
Arjun Krishnan:我們的研究對傳統(tǒng)的基因預測方法有兩個主要的貢獻,首先是我們使用了一個基因組規(guī)模的組織特異性網(wǎng)絡。人類疾病的起源和表現(xiàn)在人體中特定的組織和細胞類型,例如高血壓—腎臟,或自閉癥—大腦。因此,要準確地描述哪些基因與自閉癥類似的疾病相關,我們需要了解和預測這些基因在大腦中發(fā)生了什么,而不是在大腦以外其他人體部分。我們通過在人類基因組中使用特定的大腦網(wǎng)絡基因實現(xiàn)了這個結果,基于成千上萬的基因組實驗融合成了特定的大腦信號。
第二個貢獻是使用證據(jù)加權進行分類,我們在多個來源精心策劃了一組與ASD相關的基因,并追蹤這些來源是否可靠,使用他們的證據(jù)層級為我們的機器學習作出新的預測方法。這種方式作出的預測比基于高置信基因的預測要準確的多。
Q:你的研究對于泛自閉癥障礙(ASD)來說意味著什么?
Arjun Krishnan:目前非常需要一個基因或分子測試來對ASD進行診斷,在腦發(fā)育早期盡可能地基于ASD患者的基因組成對其進行藥物或其他干預治療。通過對這些候選基因的實驗幫助研究人員有效地縮小ASD的遺傳基礎和遺傳篩選,我們的研究結果使他們離這些目標更近了一些。
Q:你認為機器學習在醫(yī)學研究中最大的潛力是什么?
Arjun Krishnan:我所看到的機器學習的最大潛力是用其處理這個問題——針對個人的基因組成準確預測其健康和疾病的狀態(tài)。我們的工作是在重大疾病這一方面邁出的巨大一步,幫助找出基因的“特性”可能定義的疾病,希望它可以用來對疾病進行預測。重要的是在追求這一目標的過程中,不單純是在機器學習或者生物醫(yī)學研究領域中進行獨立研究,更要考慮這兩個領域如何能協(xié)同合作一起發(fā)揮巨大的潛力。
Q:下一步打算如何進行研究?
Arjun Krishnan:下一步我們正在思考的如何將我們的預測結果應用到自閉癥患者的全基因組測序研究上,這令我們十分激動。對全基因組測序研究需要面對相當復雜的情況,我們的預測結果可以幫助研究人員集中在一個變量上,落在其附近或接近的基因我們就可以將其識別為與ASD基因高度相關的選項。
文/雷鋒網(wǎng)(微信號:leiphone-sz)
來源:雷鋒網(wǎng)