發(fā)布日期:2017-06-20
給你一段5分鐘的錄音,從這段錄音里你最多能夠獲得多少信息?根據(jù)威斯康星大學(xué)麥迪遜威絲曼中心和威斯康星發(fā)現(xiàn)研究院的最新研究表明,僅靠5分鐘的談話就足以判斷某個人是否易患遺傳疾病以及相關(guān)的并發(fā)癥。
早這項剛剛發(fā)表于《Scientific Reports》的研究中,研究人員利用機(jī)器學(xué)習(xí)能力分析了數(shù)百種語音記錄,并能夠準(zhǔn)確地識別個體的突變前期的脆弱的X染色體,具有這種特征的染色體會增加神經(jīng)退行性疾病、不孕不育等病癥的風(fēng)險,此外,攜帶該染色體的人群的后代容易發(fā)生X染色體易損綜合征。
X染色體易損綜合癥的主要特征是智力和身體殘疾,目前全世界數(shù)百萬人都具有突變前期脆弱的X染色體。作為該研究的參與者,威斯康星大學(xué)研究生院副院長Marsha Mailick教授說:“這些處于突變前期的病癥仍并沒有被有效的診斷,人們通常不知道他們的患病風(fēng)險增加了。”
對突變前期脆弱的X染色體進(jìn)行診斷是一項困難的工作,該工作極為耗時并且需要大量的資源導(dǎo)致價格昂貴。“我們的研究小組希望開發(fā)一種快速、經(jīng)濟(jì)、有效篩選方法,”Mailick說。正是應(yīng)著這樣的訴求,他們開發(fā)了機(jī)器學(xué)習(xí)-人工智能計算程序。這個新型的機(jī)器人可以通過現(xiàn)有數(shù)據(jù)進(jìn)行“訓(xùn)練”,隨后去分析新信息。
威斯康星大學(xué)生物醫(yī)學(xué)工程系副教授Kris Saha認(rèn)為:“最初,我們要花費數(shù)小時的時間來分析和注釋每個記錄,通過這樣的大量的工作,最終使用它們的時候只需要不到一秒鐘。”
Mailick及其同事在之前的研究中已經(jīng)表明,系統(tǒng)的進(jìn)行語音記錄分析,可以產(chǎn)生有價值的關(guān)于具有突變前期脆弱X染色體的家庭的信息。2012年,威斯康星大學(xué)副校長Jan Greenberg領(lǐng)導(dǎo)的一項研究分析了五分鐘的母親談?wù)撍麄兊幕加蠿染色體易損綜合癥的孩子的語音記錄。研究顯示,父母營造的溫暖、積極的家庭氛圍能夠減少孩子的行為問題。
威斯康星大學(xué)通訊科學(xué)與病癥學(xué)副教授Audra Sterling選用了相同的錄音進(jìn)行研究,結(jié)果表明在具有突變前期脆弱X染色體的中年和老年婦女群體中,年齡和言語障礙有強(qiáng)烈的相關(guān)性。這些研究結(jié)果表明,錄音可以跟蹤具有突變前期脆弱X染色體的老年人的疾病發(fā)展進(jìn)程。
Mailick說:“以往進(jìn)行語音特征編碼十分耗時且需要臨床專業(yè)知識,但新的研究中所使用的方法不需要這些特性。”Saha、Greenberg、Sterling、Mailick和研究生Arezoo Movaghar聯(lián)合設(shè)計了初始的機(jī)器學(xué)習(xí)算法,該算法可以智能的將患者區(qū)分為兩組:患者有攜帶脆弱X染色體的母親和未攜帶的母親。
研究人員先分析了100個5分鐘的具有脆弱X染色體的母親所談?wù)摰木哂蠿染色體易損綜合征的孩子的錄音,隨后分析了另外100個自閉癥譜系障礙兒童的母親的錄音。
基于錄音和機(jī)器學(xué)習(xí)算法,研究人員創(chuàng)建了語言和認(rèn)知功能的列表,例如記錄中的句子的平均長度或填充暫停的數(shù)量,例如“啊”或“哦”的發(fā)音方法,這些特征可以非常有效的區(qū)分兩組的不同。目前根據(jù)這些顯著的特征,機(jī)器學(xué)習(xí)算法可以達(dá)到81%的區(qū)分準(zhǔn)確性。
根據(jù)研究人員的測算,與單獨使用基因檢測相比,使用機(jī)器學(xué)習(xí)的篩查方法在人群中診斷出1000名具有突變前期脆弱X染色體的患者可以節(jié)省超過1100萬美元。Mailick說:“這項工作是邁向更快、更具成本效益的篩選過程的第一步。我們計劃擴(kuò)大對其他人群的篩選,例如具有脆弱X染色體的男性。”
Saha說:“本研究中開發(fā)的機(jī)器學(xué)習(xí)算法不局限于脆弱X染色體診斷,未來其他疾病的診斷也可能用該算法實現(xiàn)。”Movaghar表示:“我們希望簡化收集數(shù)據(jù)的方式。”Movaghar正在致力于開發(fā)移動應(yīng)用來完成這一目標(biāo)。該應(yīng)用會問一系列簡單的個人和醫(yī)療問題,然后記錄一個五分鐘的語音樣本,數(shù)據(jù)甚至可以來自智能手機(jī)或家庭智能揚聲器中的音頻記錄。
參考資料
《Machine learning can detect a genetic disorder from speech recordings》
來源:ScienceLondon未止科技(微信號 science_london)