11月1日,在 由新華網(wǎng)與南京市經(jīng)濟和信息化委員會主辦的首屆中國智谷大會人工智能與產(chǎn)業(yè)創(chuàng)新高峰論壇上,生物信息學(xué)家、中科院院士陳潤生做了了題為《大數(shù)據(jù)與精準(zhǔn)醫(yī)學(xué)》的演講。陳潤生院士認為,隨著人工智能和大數(shù)據(jù)等技術(shù)的應(yīng)用于醫(yī)學(xué)領(lǐng)域?qū)苿泳珳?zhǔn)醫(yī)學(xué)的發(fā)展,在疾病發(fā)生之前進行采取針對性的措施,從而改變醫(yī)療健康的概念。同時,人工智能和大數(shù)據(jù)也對研究我們遺傳信息中97%的、我們尚未了解的“暗物質(zhì)信息”起到關(guān)鍵作用??傮w來看,精準(zhǔn)醫(yī)學(xué)才剛剛上路,還存在很多的機會。
以下是陳潤生院士演講全文,雷鋒網(wǎng)在現(xiàn)場實錄基礎(chǔ)上進行了不改原意的編輯:
尊敬的各位專家、各位領(lǐng)導(dǎo)、非常榮幸能參加這個會,我想今天我就大數(shù)據(jù)和精準(zhǔn)醫(yī)學(xué)談一個看法,因為現(xiàn)在大家知道,精準(zhǔn)醫(yī)學(xué)非常熱了,雖然比起人工智能還是小弟弟,但是我們知道,2005年1月20號美國總統(tǒng)奧巴馬在他發(fā)表的美國要開展精準(zhǔn)醫(yī)學(xué)研究,從那以后,精準(zhǔn)醫(yī)學(xué)就在全世界得到了普遍的重視,在很多發(fā)達國家包括我們國家不僅僅是大家都很關(guān)心的一個領(lǐng)域,我們國家領(lǐng)導(dǎo)人也多次對于精準(zhǔn)醫(yī)學(xué)的發(fā)展都有重要的指示,而且在資助上也有具體體現(xiàn)。所以我今天主要談精準(zhǔn)醫(yī)學(xué)的四個方面問題,一個是跟大家交流,也希望展開一些討論。
1. 精準(zhǔn)醫(yī)學(xué)是組學(xué)大數(shù)據(jù)跟臨床醫(yī)學(xué)的結(jié)合
第一個問題,精準(zhǔn)醫(yī)學(xué)的本質(zhì)是什么,核心是什么?我看到國內(nèi)有各種各樣的評論,關(guān)于討論精準(zhǔn)醫(yī)學(xué)的內(nèi)涵,各種觀點都有,我自己覺得,精準(zhǔn)醫(yī)學(xué)的核心其實就是一點,非常明確,就是組學(xué)大數(shù)據(jù)跟醫(yī)學(xué)的結(jié)合,說得更具體一點,就是組學(xué)大數(shù)據(jù)跟臨床醫(yī)學(xué)的結(jié)合。也就是說,把組學(xué)大數(shù)據(jù)用到臨床的醫(yī)學(xué)當(dāng)中來,提高醫(yī)療診斷的準(zhǔn)確度,提高治療的效果。
這里又包括兩層含義,一個含義是組學(xué)大數(shù)據(jù),另外一個含義是醫(yī)學(xué)。那么組學(xué)大數(shù)據(jù)又包括兩層含義,一個是組學(xué),一個是大數(shù)據(jù),我們知道,近年來,隨著臨床研究的發(fā)展,我們獲得了越來越以基因組為代表的分子水平的人類信息,這個是以前前所未有的。那么,隨著以基因組為代表的組學(xué)數(shù)據(jù)的發(fā)展,人們越來越多的積累了以遺傳密碼為代表的不僅僅是基因的信息,也包括蛋白的信息,那么后來,人們發(fā)現(xiàn),挖掘這些信息以后會得到很多的反映人類健康和疾病的信息。所以有人提出,如果把這些信息應(yīng)用到臨床當(dāng)中來,一定會提高臨床的效果,這就是所謂精準(zhǔn)醫(yī)學(xué)的本質(zhì)含義。但是,只獲得這些遺傳密碼的信息是不夠的。
大家知道,所有遺傳密碼的信息都是非常非常多的一個大數(shù)據(jù),這個大數(shù)據(jù)大家是很容易測得的,包括我們現(xiàn)在知道在我們國內(nèi),每個人花一萬塊人民幣就可以得到你的遺傳密碼,但是你得到你的遺傳密碼你是一點都不懂,因為這只有四個字(A、C、G、T),所以要讀懂他,你就要發(fā)展大數(shù)據(jù)分析的理論方法和技術(shù)。所以,那么要把這些組學(xué)數(shù)據(jù)用大臨床當(dāng)中來,必須是組學(xué)數(shù)據(jù)和大數(shù)據(jù)分析方法的結(jié)合。所以一部分是組學(xué)大數(shù)據(jù),一部分是醫(yī)學(xué),兩個結(jié)合起來,就構(gòu)成了現(xiàn)在精準(zhǔn)醫(yī)學(xué)的本質(zhì)和核心,這是第一個問題。關(guān)于精準(zhǔn)醫(yī)學(xué)的本質(zhì),他也是自上世紀90年代由于組學(xué)數(shù)據(jù)用到臨床當(dāng)中,發(fā)展轉(zhuǎn)化成轉(zhuǎn)化醫(yī)學(xué),個體化醫(yī)學(xué),現(xiàn)在從2011年有出了精準(zhǔn)醫(yī)學(xué)的名稱,但不管怎么說,都是他的本質(zhì)是清楚的,就是組學(xué)大數(shù)據(jù)在臨床醫(yī)學(xué)當(dāng)中的應(yīng)用。
2. 精準(zhǔn)醫(yī)學(xué)有可能改變醫(yī)療健康的基本概念
第二個問題:精準(zhǔn)醫(yī)學(xué)能夠使醫(yī)學(xué)帶來哪些本質(zhì)的變化。如果精準(zhǔn)醫(yī)學(xué)只是把醫(yī)學(xué)提高一點點百分數(shù)的話,我想,那么精準(zhǔn)醫(yī)學(xué)就不一定會引起更多領(lǐng)導(dǎo)人的注意。就精準(zhǔn)醫(yī)學(xué)的內(nèi)涵,一定會有一些本質(zhì)上的變化,那么這個本質(zhì)上的變化是什么?我們也用一句話來說,精準(zhǔn)醫(yī)學(xué)他的本質(zhì)上所以引起各國領(lǐng)導(dǎo)人的重視,是精準(zhǔn)醫(yī)學(xué)有可能改變醫(yī)療健康的基本概念,也就是說,促使醫(yī)療的基本概念從當(dāng)前的診斷治療轉(zhuǎn)變成健康保證。
我們知道,現(xiàn)在的醫(yī)療體系面對的是病人,那么他主要是對病人進行所謂的治療,但是,未來因為精準(zhǔn)醫(yī)學(xué)的發(fā)展,由于組學(xué)大數(shù)據(jù)的介入,那么就會使得這個時候的健康不僅僅是對病人,而是對全民,對任何人在他沒有得病的時候我們測量他的組學(xué)數(shù)據(jù),分析組學(xué)大數(shù)據(jù),那么就可以對他未來健康發(fā)展的危險因素做出評估,根據(jù)評估進行適當(dāng)干預(yù),這樣的話有些疾病不發(fā)展,有些疾病減輕他的程度,提高他的生活質(zhì)量,這樣就把整個醫(yī)療健康體系的關(guān)口前移,在沒有病之前就提出評估與保證。
(未來醫(yī)學(xué)的三個趨勢)
這樣一個根本性的概念的轉(zhuǎn)變,有人認為,有可能導(dǎo)致一些新興產(chǎn)業(yè)的出現(xiàn),有人預(yù)估,跟所謂精準(zhǔn)醫(yī)學(xué)相關(guān)的這個概念轉(zhuǎn)變導(dǎo)致的新型,也許到2018年也許到2千億美元的轉(zhuǎn)變,也就相當(dāng)于將近2萬億人民幣,對GDP就有影響。這種有精準(zhǔn)醫(yī)學(xué)帶來的本性概念的改變由此促使的產(chǎn)業(yè)的發(fā)展當(dāng)然會引起各國領(lǐng)導(dǎo)人的注意,這是第二個方面,關(guān)于精整醫(yī)學(xué)他可能帶來的一些本質(zhì)變化的估量。
精準(zhǔn)醫(yī)學(xué)研究已成為新一輪國家科技競爭與引領(lǐng)國際戰(zhàn)略的制高點。大家知道美國要測量100萬自然人的遺傳密碼,歐盟也在積極推動所謂精準(zhǔn)醫(yī)學(xué)的研究,包括英國、法國等等,日本也在進行精準(zhǔn)醫(yī)學(xué)相關(guān)的投入和計劃。那么精準(zhǔn)醫(yī)學(xué)我們?nèi)绾巫屑毞治觯赡茉谀男┓矫娲偈巩a(chǎn)業(yè)的變革和發(fā)展呢?我想至少在四個方面:
第一個可以促使海量的生物樣本庫和數(shù)據(jù)庫的發(fā)展。大家知道,由于精準(zhǔn)醫(yī)學(xué)的推動,那么需要測量百萬人量級的這些人的組學(xué)信息,首先涉及到這百萬人生物樣品的獲取,保管、提取和提供給這些人使用,這當(dāng)然是一個很大的產(chǎn)業(yè)。同時,這些樣本測完了數(shù)據(jù)是百萬人數(shù)量級的一定要促進相應(yīng)的大規(guī)模的數(shù)據(jù)庫的發(fā)展,有人估計,這個產(chǎn)業(yè)的規(guī)??赡苁前賰|數(shù)量級。
第二個有了這些樣品,那么就要測以基因組為代表的這些組學(xué)數(shù)據(jù),所以就要測基因組、蛋白組、轉(zhuǎn)錄組,這些測序的數(shù)據(jù),僅僅到2018年,就可以到117億美金的規(guī)模。那么有了樣本庫,有了組學(xué)數(shù)據(jù)的測量,那么下一步在這些海量數(shù)據(jù)挖掘的基礎(chǔ)上,就可以促進產(chǎn)生大量的新的分子診斷的指標(biāo)。我們知道,就會增加很多跟疾病相關(guān)的信息,這些信息當(dāng)中,有很多就可以作為新的疾病的標(biāo)記。同時,也可以發(fā)現(xiàn)很多新的藥物設(shè)計的靶點,這就促進了第三個產(chǎn)業(yè),也就是所謂分子診斷和藥物設(shè)計靶點的相關(guān)產(chǎn)業(yè)。
第四個當(dāng)然伴隨著精準(zhǔn)醫(yī)學(xué)概念而產(chǎn)生的新的醫(yī)療設(shè)施,比如說要成立一些健康源,要一些健康師,這些方面是可以和現(xiàn)在醫(yī)院、醫(yī)生相關(guān)系的產(chǎn)業(yè)大概是千億數(shù)量,這些產(chǎn)業(yè)必然會帶來變革,國內(nèi)已經(jīng)有所體現(xiàn),有成百上千個小的公司在逐漸地成立了。當(dāng)然他們怎么來更好的發(fā)展,有待討論。
(精準(zhǔn)醫(yī)學(xué)將帶動基因測序、分子診斷、個體化治療等市場規(guī)模的擴大)
我們國家的精準(zhǔn)醫(yī)學(xué)發(fā)展目標(biāo)我不贅述了,跟國際是一致的,這第二個方面,精準(zhǔn)醫(yī)學(xué)可以帶來哪些本質(zhì)的變化,如何促進產(chǎn)業(yè)的發(fā)展,在那幾個產(chǎn)業(yè)發(fā)展可以帶動或引導(dǎo)。
3. 如何才能精準(zhǔn)?
第三個我要說一個問題是要實現(xiàn)精準(zhǔn)醫(yī)學(xué),要做哪些點?做到哪些點,才能做到精準(zhǔn)?那么精準(zhǔn)醫(yī)學(xué)我覺得至少要具備兩個條件,第一個,要具備組學(xué)大數(shù)據(jù)的基礎(chǔ),我們知道,精準(zhǔn)醫(yī)學(xué)就是把組大數(shù)據(jù)用到臨床當(dāng)中來,所以第一個你要獲取組學(xué)大數(shù)據(jù),那么也就是獲取基因組,蛋白組、轉(zhuǎn)入組、代謝組等等這些組學(xué)數(shù)據(jù),這些數(shù)據(jù)本身是沒有用的,第二步就是組學(xué)數(shù)據(jù)的挖掘,挖掘的話就會用到大數(shù)據(jù)分析的理論方法,包括剛才張鈸院士講的人工智能的方法,深度學(xué)習(xí)的方法等等,以知識為基礎(chǔ)的方法用來挖掘這些組學(xué),以獲得在分子水平上跟疾病相關(guān)的知識,這是第一個基礎(chǔ)。
(精準(zhǔn)醫(yī)學(xué)的基礎(chǔ))
有了這些分子知識和組學(xué)知識的用到臨床疾病當(dāng)中來,還要建立第二個基礎(chǔ),就是搭建分子水平的以基因型為代表的信息核,建立這種橋梁之后才能有效把分子水平的信息轉(zhuǎn)化應(yīng)用到疾病的診斷和治療當(dāng)中來,那么這就是要建立所謂生物信息學(xué)、生物網(wǎng)絡(luò),系統(tǒng)生物學(xué)等等的方面,有了這兩個基礎(chǔ)我們就可以更好地實現(xiàn)精準(zhǔn)醫(yī)學(xué),當(dāng)然一個非常重要的就是精準(zhǔn)醫(yī)學(xué)的發(fā)展,是應(yīng)當(dāng)和當(dāng)前的臨床的影象學(xué)、臨床的生化檢驗、當(dāng)前臨床的知識很好地融合下,并不是有些公司他測的序什么都決定了,實際上不是那樣,是應(yīng)該更好地結(jié)合起來才能更好做到精準(zhǔn)。精準(zhǔn)醫(yī)學(xué)只是把新的數(shù)據(jù)應(yīng)用在原有的數(shù)據(jù)上使得更好地提高。
4. 精準(zhǔn)醫(yī)學(xué)才剛剛上路
第四個說的精準(zhǔn)醫(yī)學(xué)現(xiàn)在在什么階段,發(fā)展到什么階段?大家知道,可能我們目前精準(zhǔn)醫(yī)學(xué)成為大家的熱詞以后,大家認為我們現(xiàn)在什么都可以精準(zhǔn),醫(yī)學(xué)很容易精準(zhǔn)了,我個人的觀點,精準(zhǔn)醫(yī)學(xué)其實雖然是本質(zhì)上可能帶來變革,可能引導(dǎo)新的產(chǎn)業(yè)的發(fā)展,也許產(chǎn)業(yè)規(guī)模是巨大的,但是現(xiàn)在才剛剛上路,才剛剛開始!為什么?是在精準(zhǔn)醫(yī)學(xué)的概念下,我們目前依然存在著巨大的挑戰(zhàn),我們依然存在著巨大的困難。因此,我下面會舉一兩個例子來說明精整醫(yī)學(xué)目前存在什么樣的困難?
為什么說精準(zhǔn)醫(yī)學(xué)才剛剛上路呢?我們的創(chuàng)新的機遇在哪里,我們迎接挑戰(zhàn)在哪兒?我拿組學(xué)當(dāng)中只舉一個例子,在我們的臨床密碼當(dāng)中,在我們的組學(xué)當(dāng)中,目前,還存在著大量的暗信息,所謂我們的自己的遺傳密碼目前我們能夠從規(guī)律上分析的只有一小部分,其他還不能分析的就是基因組當(dāng)中的所謂暗信息。我們一個人的遺傳密碼信息是3*10的九次方,如果裝訂成冊,每3千個字符一頁,100頁裝訂層一冊,那就是一萬冊。如果一萬冊書每一冊一厘米,我們自己的基因密碼書就是就是一百米,大家可以想像,你自己的遺傳密碼從地面上排到四十層樓房那么高,如果你全部讀懂了,你就精準(zhǔn)。我相信沒有誰能精準(zhǔn),我現(xiàn)在要告訴大家的是集全世界科學(xué)家的智慧,包括生物醫(yī)學(xué)家的智慧,這本天書世界上能夠從規(guī)律上了解的部分只有遺傳密碼的3%,另外的97%實際上集目前全世界的智慧還不懂。迄今為止我們的遺傳密碼97%是暗的,我想在下面給大家做一些展開性的說明。
(2010年science雜志評出的“新世紀10年杰出發(fā)現(xiàn)”:基因暗物質(zhì))
首先從遺傳密碼來講,我們其實,我們的97%的遺傳密碼,從總體,從規(guī)律上來講,我們?nèi)祟愡€不了解,那3%我們了解的是從中學(xué)大家就知道的,尊從中心發(fā)展的蛋白質(zhì)信息,那3%就是造蛋白質(zhì)的遺傳密碼,我們知道他的歸類了,也知道他的信息,但另外的97%的遺傳密碼是跟制造蛋白組無關(guān)的,這些信息,迄今為止我們不知道他做什么用的,這就是遺傳密碼當(dāng)中的所謂暗物質(zhì),也是遺傳密碼當(dāng)中的非編碼序列,那么這個概念,大家可以想一想,當(dāng)我們測遺傳密碼,而97%的密碼還不知道的情況下我們?nèi)绾巫龅骄珳?zhǔn)呢?所以離精準(zhǔn)還差了很很大的距離。
(不同生物基因解碼的程度)
進入21世紀科學(xué)家提出問題,說這些我們還不了解的、占人類基因組97%的暗物質(zhì)遺傳密碼,那是否有轉(zhuǎn)錄產(chǎn)物,是否有信息發(fā)放?換句話說,他是否在活動,在行使功能呢?這個結(jié)果是100%肯定的,這些非編碼序列和我們制造蛋白的那些基因一樣,每時每刻都在表達,每時每刻都在起作用,所以他們也是真正地完成生物學(xué)功能,那么這些東西我可以舉幾個例子說明,他跟腫瘤的關(guān)系,當(dāng)然,雖然我們不全部了解它,但是已經(jīng)有些支離破碎的例子說明他的生物學(xué)功能。比如說有一個來自97%的這樣一個產(chǎn)物,它叫PCGEM1,可以導(dǎo)致前列腺癌,不是由于蛋白引起的。還有MALAT-1,它可以導(dǎo)致非小細胞肺癌,我們大家知道我們國家肺癌是增速中,我們現(xiàn)在臨床醫(yī)院當(dāng)中,檢測腫瘤用的指標(biāo)都是我講的3%,而治療的靶點你用的藥物也是對那3%,我現(xiàn)在告訴你,那97%,有很多例子證明,他也與腫瘤有關(guān),但從來沒有納入到我們臨床之診斷和治療當(dāng)中來,你想這個腫瘤能治得好嗎?你沒有考慮他,當(dāng)然沒有想到檢測和治療他,就是說,我們還有一個97%與疾病情況有關(guān)的東西迄今沒有那么融入到我們診斷治療的視野當(dāng)中,這就是精準(zhǔn)醫(yī)學(xué)面臨著組學(xué)的所謂的暗信息的巨大挑戰(zhàn)。
(長鏈非編碼MALAT-1 RNA與肺癌的關(guān)系)
我們知道那個97%(的遺傳暗物質(zhì)信息)是和我們疾病,和我們的健康息息相關(guān)。我們有多少這樣的編碼沒有發(fā)現(xiàn)呢?我們大概有25000個基因,那些97%的我們現(xiàn)在能不能評估一下,他有多少原件呢?因為倫理上的原因?qū)θ宋覀冞€不知道,遺傳研究所對老鼠做過研究,把所有的原件都拿來,管你是編碼還是非編碼,一共發(fā)現(xiàn)的18萬1千個,這是在老鼠里面真正執(zhí)行功能的原件的下限,實際上一定會比他大,在這里發(fā)現(xiàn),產(chǎn)生意義的3%決定了兩萬個原件,換句話說我們還有16萬1千個(非編碼RNA)來自那97%,這16萬1千個據(jù)我所知,目前我們?nèi)澜缈茖W(xué)家解析了大約1千個,換句話說,還有16萬個機會,有太多的機會有些非常重要的元件功能的發(fā)現(xiàn)。這些領(lǐng)域2016由這兩位就是在那97%研究當(dāng)中,我曾經(jīng)開過一個玩笑,大家算算,從1900年研究那3%大約締造了50名諾貝爾獎獲得者,現(xiàn)在知道了還有97%,97比3,那個大約是1300左右,所以我們有一千多個機會在這個領(lǐng)域做出諾貝爾獎級別的原創(chuàng)性特殊貢獻,而只有一個位置被占據(jù),所以我們還有巨大的機會。
(大量非編碼RNA蘊含大量的機會)
因此,我們從精準(zhǔn)醫(yī)學(xué)來講,我們現(xiàn)在其實不能做的精準(zhǔn)是因為有一個巨大的大數(shù)據(jù),只是指他的內(nèi)涵并沒有被挖掘,但是另一方面,他可以給我們提供一個全新的機會,不管對技術(shù)研究還是產(chǎn)業(yè)發(fā)展都有巨大研究,所以對非編碼的研究無疑會對疾病的診斷治療提供全新的診斷方向,或者對藥物的設(shè)計研發(fā)提供新的平臺,對新的物種,新的性狀的培育提供一個新的基礎(chǔ),對于組學(xué)的方向有很多,精準(zhǔn)醫(yī)學(xué)其實才剛剛開始。
大家都是大數(shù)據(jù)的專家,我想我只能非常快的說說題目,其實對大數(shù)據(jù)的分析,依然存在著有些核心的挑戰(zhàn),第一個數(shù)據(jù)量大,大家知道,現(xiàn)在的測序儀一個普通的一次運行就可以到1T的數(shù)據(jù),全世界有成千上萬個這樣的儀器,包括我的組里就有所謂的得到一個T的數(shù)據(jù),所以這些數(shù)據(jù)量是非常大的。那么每個人有3×10的九次方。這個數(shù)據(jù)告訴大家,從數(shù)據(jù)質(zhì)量來講,他的噪音很高,同時又大量缺失值的這樣一個數(shù)據(jù)源。第二個樣本很小,我們要解決腫瘤的問題,但是我們知道腫瘤的變量,自變量可能成前上萬,但是我們?nèi)颖局挥邪贁?shù)量級,因此我們?yōu)槭裁匆獪y,比方要研究腫瘤或者是心腦血管病,他的自身變量千數(shù)量級,我們的百萬級,就像政府,測一百萬人總夠了,第二個,我們建立合適的數(shù)學(xué)模型,借助人工智能和機器學(xué)習(xí)等方法,使得我們能夠相匹配。大家知道不僅僅是組學(xué)數(shù)據(jù),也還有生物學(xué)數(shù)據(jù),更需要我們不僅僅是科技界,企業(yè)界,我們知道我們國內(nèi)數(shù)據(jù)共享存在基本一個重要的問題,如果一個數(shù)據(jù)共享問題不解決,我們就是在大數(shù)據(jù)時代做小數(shù)據(jù)的工作,發(fā)表小數(shù)據(jù)的企業(yè),顯然不能適應(yīng)國際競爭的態(tài)勢。
后面我講的很粗糙,對不起,占用大家的時間,謝謝!
在陳潤生院士做完演講后,雷鋒網(wǎng)記者也對陳院士進行了短暫采訪:
問:精準(zhǔn)醫(yī)療目前最主要的挑戰(zhàn)在哪里?
答:我們的挑戰(zhàn)很多。精準(zhǔn)醫(yī)療的基礎(chǔ)是組學(xué)大數(shù)據(jù),包括組學(xué)和大數(shù)據(jù)都存在著挑戰(zhàn)。比如組學(xué),我們很容易測量得到數(shù)據(jù),但對數(shù)據(jù)的內(nèi)涵大部分我們并不知道。從大數(shù)據(jù)的挖掘本身也有很多問題,今天沒有時間展開講,包括數(shù)據(jù)本身生物學(xué)含義的挖掘,包括數(shù)據(jù)樣本、數(shù)據(jù)集本身的缺陷比如說缺失值,還有原件之間的相互作用等,都依然存在很多問題。但從另外一方面講這是機會,我們對于未知數(shù)據(jù)的研究,了解一點,我們就可以推進一點,然后應(yīng)用一點,從而推動整個精準(zhǔn)醫(yī)療的發(fā)展。
問:我們進行精準(zhǔn)醫(yī)療研究的條件和國際相比如何?
答:最近這么多年,我們國家對精準(zhǔn)醫(yī)療的重視、包括對基礎(chǔ)研究方面的投資,實際上從技術(shù)條件和研究上來講并不存在根本困難,困難來自于科研當(dāng)中的組織等各種方面的問題,以及基礎(chǔ)研究如何從思想上來提高創(chuàng)新意識。從發(fā)表論文方面,我們是僅次于美國的第二名,但重要的是做到自己的獨創(chuàng)性研究,而不是跟隨。
問:您有提到“需要百萬級別的樣本”,我們已經(jīng)知道像Deepmind、23andme等企業(yè)已經(jīng)在與衛(wèi)生部門和醫(yī)院合作獲取百萬級別的樣本數(shù)據(jù),我們國內(nèi)有類似的例子嗎?
答:國內(nèi)有一些項目,如精準(zhǔn)醫(yī)學(xué)研究的計劃就計劃測100萬數(shù)據(jù),而且也在進行中。但是我覺得測哪個100萬數(shù)據(jù)并不重要,重要的是我們有很多數(shù)據(jù),需要有一個機制去整合起來,這樣比你不斷測試新的數(shù)據(jù)更重要。
嘉賓簡介
陳潤生,生物信息學(xué)家,中國科學(xué)院院士?,F(xiàn)為中國科學(xué)院生物物理研究所研究員、博士生導(dǎo)師。國際人類基因組組織(HUGO)會員。在基因標(biāo)注、生物進化、SNP數(shù)據(jù)分析、生物網(wǎng)絡(luò)、非編碼基因等方面進行了系統(tǒng)、深入的研究,曾參加我國第一個完整基因組泉生熱袍菌 B4基因組序列的組裝和基因標(biāo)識,曾參加人類基因組1%和水稻基因組工作草圖的研究。近年來主要從事非編碼RNA的系統(tǒng)發(fā)現(xiàn)與功能研究。