發(fā)布日期:2017-03-08
在動(dòng)脈網(wǎng)發(fā)布的2016中國“未來醫(yī)療100強(qiáng)”榜單中,基因檢測(cè)領(lǐng)域異軍突起,上榜企業(yè)18家,是所涉及領(lǐng)域中上榜企業(yè)最多的領(lǐng)域,其中華大基因更是以200億人民幣的市場(chǎng)估值位居榜首。隨著成本的持續(xù)降低,基因概念的日益普及,基因檢測(cè)公司正以創(chuàng)新基因技術(shù)在醫(yī)療健康產(chǎn)業(yè)中的爆發(fā)。另一方面,精準(zhǔn)醫(yī)療被寫進(jìn)“十三五”,NIPT試點(diǎn)取消,政策環(huán)境的利好也為基因檢測(cè)企業(yè)成長提供了優(yōu)渥的土壤。
一面是基因檢測(cè)的日益普及,一面是越來越大規(guī)模的數(shù)據(jù)產(chǎn)出。如此大規(guī)模的數(shù)據(jù),如何這存儲(chǔ)、分析以及解讀成為行業(yè)必須要突破的瓶頸和壁壘。人類全基因組數(shù)據(jù)大約有30億字符,為了保證解讀準(zhǔn)確性,慣例是要將每個(gè)字符閱讀30遍以上,相當(dāng)于1000億字符。如此算下來,且不說分析和解讀,光是數(shù)據(jù)的閱讀都是極大的工程。
國內(nèi)知名基因檢測(cè)公司全基因組檢測(cè)周期為3個(gè)月,其中從采樣到測(cè)序完成耗時(shí)一個(gè)月,而剩下的兩個(gè)月,都用在了數(shù)據(jù)的分析和解讀上。2017年,全球測(cè)序巨頭Illumina推出NovaSeq測(cè)序系列,再次刷新了測(cè)序成本新低。這就意味著,一大波數(shù)據(jù)正在接近。如何尋找更高效的數(shù)據(jù)處理方案,如何提升數(shù)據(jù)解讀速度,無疑將是行業(yè)下一個(gè)議題。
動(dòng)脈網(wǎng)(微信號(hào):vcbeat)梳理了42家基因數(shù)據(jù)分析和解讀細(xì)分領(lǐng)域相關(guān)企業(yè),希望能從產(chǎn)業(yè)角度切入,對(duì)行業(yè)現(xiàn)狀做出解析。
以初創(chuàng)企業(yè)為主,暫無獨(dú)角獸出現(xiàn)
42家企業(yè)中,超過半數(shù)企業(yè)的成立時(shí)間在2010年以后。早期成立的企業(yè),如華大、貝瑞和康以及華因康,其本身業(yè)務(wù)的綜合性就比較強(qiáng),故嚴(yán)格意義上講,這個(gè)行業(yè)內(nèi)還沒有獨(dú)角獸出現(xiàn)。像賽?;?、華點(diǎn)云以及聚道科技以數(shù)據(jù)服務(wù)為主營業(yè)務(wù)的企業(yè),甚至是像人和未來這樣以生物技術(shù)和信息技術(shù)學(xué)科交叉為核心優(yōu)勢(shì)的初創(chuàng)企業(yè),成立時(shí)間都在2013年前后。2013年開始,基因數(shù)據(jù)服務(wù)相關(guān)企業(yè)開始活躍起來。當(dāng)然,也不排除這一時(shí)期整個(gè)基因檢測(cè)領(lǐng)域創(chuàng)業(yè)潮帶來的整體基數(shù)的影響。但近年來,像是百邁克,安諾優(yōu)達(dá)以測(cè)序服務(wù)為核心業(yè)務(wù)的企業(yè)都開始向數(shù)據(jù)領(lǐng)域擴(kuò)展,似乎也預(yù)示了數(shù)據(jù)分析環(huán)節(jié)發(fā)展的大趨勢(shì)。
目前,這些企業(yè)融資輪次主要集中在天使輪和A輪,規(guī)模都還比較小。42家企業(yè)中有12家屬于業(yè)務(wù)拓展,其中有7家融資階段在A輪以后。市場(chǎng)內(nèi)的B輪玩家多是通過業(yè)務(wù)拓展進(jìn)入市場(chǎng),這些企業(yè)更多代表的是一種市場(chǎng)趨勢(shì),并不能代表市場(chǎng)內(nèi)企業(yè)的成熟度。
產(chǎn)品服務(wù):“云服務(wù)”是趨勢(shì)
從產(chǎn)品分布來看,傳統(tǒng)的生物信息手段依然占據(jù)主流,但基于云的PAAS、SAAS等云平臺(tái)正在崛起。無疑,云上的數(shù)據(jù)計(jì)算、傳輸和分析將為用戶省去大量的硬件包袱,同時(shí)還可將這些環(huán)節(jié)集中在一個(gè)場(chǎng)所,為用戶帶來更輕松,更高效的體驗(yàn),這樣的云體驗(yàn)也正在成為數(shù)據(jù)處理的趨勢(shì)。
傳統(tǒng)分析應(yīng)用最廣
分析軟件和系統(tǒng)是分析環(huán)節(jié)應(yīng)用層面最廣的產(chǎn)品,是比較傳統(tǒng)的生物信息分析手段。分析軟件的廣度小,操作難度低。相比之下,數(shù)據(jù)分析系統(tǒng)比較多元化,不同復(fù)雜程度的數(shù)據(jù)分析系統(tǒng)應(yīng)用廣度也不一樣。比較全面的分析系統(tǒng)從IT構(gòu)架和分析算法流程考慮的比較多,而簡單的系統(tǒng)和軟件之間的差別并不太大。這一類產(chǎn)品的企業(yè)分布密度最大,一共有27家,代表性的企業(yè)有貝瑞和康、烈冰科技等等。
新老玩家齊入場(chǎng),“云服務(wù)”是未來趨勢(shì)
傳統(tǒng)IT手段以外,基于云端的計(jì)算和分析平臺(tái)也在向基因數(shù)據(jù)靠攏。更輕量級(jí)的存儲(chǔ)方案,以及更高效性的運(yùn)算性能,云平臺(tái)在數(shù)據(jù)處理中發(fā)揮著積極作用。
1PaaS:為基因領(lǐng)域搭建云環(huán)境
與阿里云、百度云、華為云等IaaS(基礎(chǔ)設(shè)施即服務(wù))平臺(tái)相比,PaaS平臺(tái)更具針對(duì)性,可針對(duì)某個(gè)領(lǐng)域的特點(diǎn)提供更加專業(yè)的服務(wù)。平臺(tái)會(huì)根據(jù)自身服務(wù)領(lǐng)域搭建一個(gè)云環(huán)境,方便細(xì)分領(lǐng)域的公司盡快使用。對(duì)于細(xì)分領(lǐng)域公司來講,基因領(lǐng)域PaaS平臺(tái)的出現(xiàn),省去了自行搭建平臺(tái)的環(huán)節(jié),節(jié)省了大量的時(shí)間和成本。
針對(duì)基因領(lǐng)域的PaaS平臺(tái)在國外起步比較早,代表性企業(yè)Seven Bridge , DNAnexus, T
ute Genomic等等。而近些年,國內(nèi)的生物信息云服務(wù)商開始走向市場(chǎng)。其中一部分是進(jìn)行業(yè)務(wù)拓展的早期企業(yè),比如華大和百邁客生物。另一類則是像聚道科技,華點(diǎn)云這樣以云服務(wù)為核心的初創(chuàng)公司?;蚪M數(shù)據(jù)的產(chǎn)生規(guī)模與測(cè)序成本息息相關(guān),這些企業(yè)成立時(shí)間與測(cè)序成本下降時(shí)間節(jié)點(diǎn)基本吻合。
2013年,原華大生物信息骨干陳晨從中國疾病預(yù)防控制中心傳染病所生物信息室主任的位置上辭職,創(chuàng)辦了專門面向臨床生物信息服務(wù)的華點(diǎn)云。華點(diǎn)云部署在華為云平臺(tái)上,積累了500多項(xiàng)生物信息應(yīng)用,針對(duì)臨床實(shí)驗(yàn)室缺乏生物信息解決方案的痛點(diǎn),提供生物信息數(shù)據(jù)分析和報(bào)告。
不同與華點(diǎn)云,聚道科技則從數(shù)據(jù)的安全、高效和易用性入手,提高數(shù)據(jù)傳輸效率和軟件運(yùn)行效率,為想用云計(jì)算但不知道如何使用的生物公司提供云計(jì)算資源調(diào)度服務(wù)。2014年,一批阿里出身的技術(shù)團(tuán)隊(duì)成立了基因大數(shù)據(jù)計(jì)算服務(wù)平臺(tái)聚道科技。平臺(tái)可提供基因數(shù)據(jù)的傳輸、存儲(chǔ)、分析、計(jì)算和應(yīng)用的一體化解決方案,將生物信息云服務(wù)化。同時(shí)提供開放的接口,讓用戶能夠方便的來管理和操作數(shù)據(jù),最后根據(jù)用戶需求生產(chǎn)報(bào)告。
另外,通過運(yùn)用數(shù)據(jù)壓縮技術(shù)來減少傳輸和存儲(chǔ)的時(shí)間及成本,使用分布式調(diào)度和執(zhí)行引擎來加速數(shù)據(jù)分析速度和通量,聚道 提供的云服務(wù)不僅可以幫助用戶減免硬件的維護(hù)和更新費(fèi)用,還可以降低數(shù)據(jù)分析的成本門檻。同時(shí),基于這樣的云平臺(tái),使得許多復(fù)雜的,本地不可承受的多樣本分析任務(wù)不再受制于有限的本地?cái)?shù)據(jù)處理能力。
一方面是這些以云服務(wù)為核心的初創(chuàng)企業(yè)崛起,另一方面,產(chǎn)業(yè)鏈中游或者綜合業(yè)務(wù)的企業(yè)也在積極迎接這股云潮流。
2015年4月,憑借豐富的下一代測(cè)序數(shù)據(jù)分析經(jīng)驗(yàn),華大基因開發(fā)了基于“云”的解決方案BGI Online,來應(yīng)對(duì)海量下一代測(cè)序數(shù)據(jù)的分析、存儲(chǔ)和共享的傳統(tǒng)難題。BGI Online擁有強(qiáng)大可靠的基礎(chǔ)設(shè)施和一流的安全性,可為各種類型、大小的機(jī)構(gòu)提供數(shù)據(jù)存儲(chǔ)、自動(dòng)化分析、數(shù)據(jù)傳輸、生物信息方法開發(fā)和共享服務(wù)。該平臺(tái)使用了最先進(jìn)的資源管理系統(tǒng),以確保資源在運(yùn)行計(jì)算任務(wù)時(shí)的精準(zhǔn)分配和實(shí)時(shí)的任務(wù)監(jiān)控,并對(duì)可能遇到的錯(cuò)誤進(jìn)行及時(shí)反饋。
在這樣一個(gè)平臺(tái)上,用戶可以基于華大基因的開源軟件,創(chuàng)建自己的分析工具。更重要的是,用戶的分析工具還可以與BGI Online平臺(tái)的公共分析工具、生物信息分析工具和其他資源相融合,從而建立一整套更符合用戶自身研究需求的分析流程。
2016年2月,BGI Online beta版本在阿里云上線,這也是首個(gè)完全部署在阿里云上的大規(guī)模生物信息分析平臺(tái)。依托阿里云的彈性存儲(chǔ)和計(jì)算優(yōu)勢(shì),BGI Online不但可以滿足基礎(chǔ)科研、農(nóng)作物育種及臨床應(yīng)用等不同應(yīng)用場(chǎng)景和模式對(duì)數(shù)據(jù)處理、存儲(chǔ)和傳輸?shù)男枨?,還通過使用一系列先進(jìn)的數(shù)據(jù)技術(shù),滿足HIPAA法案等行業(yè)安全條例的要求。
同時(shí),使用內(nèi)資服務(wù)器存儲(chǔ)和分析敏感的基因數(shù)據(jù)也更加符合我國《人類遺傳資源管理辦法》的規(guī)范。簡潔易用的界面和高度安全的特性,使醫(yī)生和研究者們可以把管理數(shù)據(jù)、硬件維護(hù)等繁雜的工作交給BGI Online和阿里云,從而更專注于他們要解決的科學(xué)和臨床問題。
這意味著,對(duì)于科研院所、醫(yī)療機(jī)構(gòu)及中小型基因行業(yè)創(chuàng)業(yè)公司來說,只要擁有基因數(shù)據(jù),不必自建和維護(hù)昂貴而復(fù)雜的計(jì)算、存儲(chǔ)平臺(tái),通過BGI Online便可以解碼神秘基因背后的奧秘。這家全球最大的基因組學(xué)研發(fā)機(jī)構(gòu)打開了基因行業(yè)這扇神秘大門,讓基因行業(yè)變得“觸手可及”。
當(dāng)然,華大并非是唯一一家進(jìn)行云業(yè)務(wù)拓展的企業(yè)。2015年7月,百邁客也推出了為科研人員量身定制的生物大數(shù)據(jù)信息分析平臺(tái)百邁客云,為用戶提供完整的生物信息分析以及整合利用公共數(shù)據(jù)的解決方案。
除了中游企業(yè),一些傳統(tǒng)生物信息公司,比如烈冰科技、美吉生物旗下桑格信息也在積極的往云上轉(zhuǎn)移。
另外,像是加速芯片和數(shù)據(jù)壓縮工具等輔助性軟件也在數(shù)據(jù)處理環(huán)節(jié)發(fā)揮著輔助作用。這類產(chǎn)品的作用并不是解決什么問題,而是如何將這個(gè)問題更好的解決。比如更高效的計(jì)算、更快速高質(zhì)量的壓縮等等。目前,涉及輔助性軟件的企業(yè)比較少,基于這類產(chǎn)品的自身屬性,形成專職企業(yè)的可能性不大。
2SaaS:數(shù)據(jù)分析的云上APP
另一類則是SaaS(軟件即服務(wù))平臺(tái),如果說以上的PaaS平臺(tái)是為基因組學(xué)搭建了一個(gè)云端環(huán)境的話,那么SaaS則是在這個(gè)云環(huán)境中提供可應(yīng)用的工具。這就類似于手機(jī)上的APP,服務(wù)商將應(yīng)用軟件統(tǒng)一部署在自己的服務(wù)器上,客戶可根據(jù)自己的實(shí)際需求,通過互聯(lián)網(wǎng)向服務(wù)商訂購所需的應(yīng)用軟件服務(wù),按照定購服務(wù)多少和時(shí)間向服務(wù)商支付費(fèi)用,并通過互聯(lián)網(wǎng)獲得服務(wù)。
2015年,基云惠康的云分析服務(wù)正式上線,專注于個(gè)人全基因組數(shù)據(jù)分析?;苹菘邓罱ǖ木蛯儆赟aaS服務(wù),以阿里云為基礎(chǔ),針對(duì)全基因組數(shù)據(jù),提供更快,更低成本的優(yōu)化服務(wù)。
同樣是在2015年,專注消費(fèi)級(jí)基因的水母基因也在阿里云提供的云基礎(chǔ)上推出健康管理SaaS平臺(tái)。基于這樣一個(gè)精準(zhǔn)健康管理的SaaS系統(tǒng),水母基因打造了以基因數(shù)據(jù)為核心的疾病精準(zhǔn)預(yù)防系統(tǒng),為每一位客戶建立私人健康檔案,收集客戶自身健康相關(guān)的所有數(shù)據(jù),如病史、生活飲食習(xí)慣、基因數(shù)據(jù)、血壓、血糖等。實(shí)現(xiàn)以基因數(shù)據(jù)為指導(dǎo)的疾病預(yù)防,為企業(yè)客戶提升服務(wù)品質(zhì)。
奇云諾德則是把目光放在了基因測(cè)序企業(yè)的后臺(tái)計(jì)算服務(wù)上,為基因檢測(cè)企業(yè)提供數(shù)據(jù)存儲(chǔ)、云計(jì)算、分析、結(jié)果讀取和報(bào)告生成的一條龍服務(wù)。幫助檢測(cè)環(huán)節(jié)企業(yè)迅速拿出優(yōu)質(zhì)的產(chǎn)品報(bào)告。此外,奇云諾德還開展了訂制和研發(fā)外包服務(wù),也可以聯(lián)合基因檢測(cè)企業(yè)開發(fā)所需產(chǎn)品。
2016年,基于阿里云在批量運(yùn)算上的優(yōu)勢(shì),以及安諾優(yōu)達(dá)自成立以來積累的大量生物樣本和基因數(shù)據(jù),兩家公司聯(lián)合推出了生物大數(shù)據(jù)分析云平臺(tái)“安諾云”。希望實(shí)現(xiàn)對(duì)高通量基因測(cè)序數(shù)據(jù)的快速分析、安全存儲(chǔ),提供生物大數(shù)據(jù)存儲(chǔ)與管理服務(wù)以及生物、臨床研究數(shù)據(jù)分析一體化服務(wù),推動(dòng)我國精準(zhǔn)醫(yī)學(xué)的進(jìn)程。
PAAS平臺(tái)帶來了輕量級(jí)的基因數(shù)據(jù)的傳輸和存儲(chǔ),簡化了基因數(shù)據(jù)分析流程;而SaaS平臺(tái)又降低了基因數(shù)據(jù)分析門檻,為有生物信息分析需求,但又對(duì)技術(shù)了解不深的群體提供了便利。在以前,數(shù)據(jù)傳輸主要通過網(wǎng)絡(luò)和硬盤傳輸來實(shí)現(xiàn),無論是從周期和成本來看,都不是最好的解決方案。而PaaS和SaaS云平臺(tái)的出現(xiàn),再加持云計(jì)算這樣的高并行工具,這就相當(dāng)于將數(shù)據(jù)的存儲(chǔ)、傳輸、分析以及計(jì)算都集中到了云端,掙脫了本地處理的枷鎖,使得整個(gè)數(shù)據(jù)處理過程都流暢輕快了許多。
有趣的是,無論是PaaS平臺(tái)還是SaaS平臺(tái),絕大多數(shù)企業(yè)都選擇了與阿里云合作,作為自身平臺(tái)搭建的云基礎(chǔ)。比如華大、聚道,以及基云惠康、安諾云等等。目前,市場(chǎng)上的云玩家一共18位,其中PaaS平臺(tái)10家,SaaS平臺(tái)8家。
解讀環(huán)節(jié)是高原地帶
傳統(tǒng)生物信息占據(jù)半壁江山,云平臺(tái)也正在蔓延,相比之下,解讀環(huán)節(jié)則略顯冷清。解讀環(huán)節(jié)可以說是瓶頸中的瓶頸,由于大部分疾病都是多基因遺傳病,由多個(gè)基因共同控制,不同的基因突變,不同的突變位點(diǎn),不同的突變類型,這些因素都會(huì)影響到疾病的最終表型。
另外,基因組包含的信息很多,而真正為人們真正所了解的大約只占總體的2%,很多基因的功能尚不明確。再加之基因與疾病的對(duì)應(yīng)關(guān)系還沒有建立起來,解讀過程中有太多的不確定性,更多需要人工做判斷。即使有鹍遠(yuǎn)基因這樣的夢(mèng)之隊(duì),也難以解決行業(yè)層面上的問題。無論是科研還是臨床上,數(shù)據(jù)的解讀環(huán)節(jié)都存在極大的局限性和挑戰(zhàn)性。
賽?;?、鹍遠(yuǎn)基因、基云惠康幾家企業(yè)提出將服務(wù)產(chǎn)品化,提供從測(cè)序到解讀的一站式服務(wù),希望利用自己在解讀環(huán)節(jié)的優(yōu)勢(shì),將基因數(shù)據(jù)解讀低門檻化。采取同樣策略的還有奇云諾德和安諾優(yōu)達(dá)的安諾云項(xiàng)目,但兩家公司更多傾向于測(cè)序環(huán)節(jié)后的所有服務(wù),通過將測(cè)序與數(shù)據(jù)分析解讀環(huán)節(jié)明確分工,降低基因檢測(cè)行業(yè)門檻,同時(shí)更深度的挖掘基因數(shù)據(jù)背后的價(jià)值。
目前,這個(gè)環(huán)節(jié)涉獵企業(yè)非常少,可以說是高原地帶。如果把解讀服務(wù)和半自動(dòng)化解讀工具,甚至文本挖掘都算進(jìn)來,一共不足10家。其中提供半自動(dòng)換解讀工具的,僅有兩家。
解讀環(huán)節(jié)的人力解放,數(shù)據(jù)庫是基礎(chǔ)
接著上文講,由于疾病復(fù)雜性和人類對(duì)基因與疾病關(guān)系的認(rèn)識(shí)還在一個(gè)較淺的層面,數(shù)據(jù)解讀環(huán)節(jié)受制于人力因素。其實(shí)半自動(dòng)化數(shù)據(jù)解讀并不難實(shí)現(xiàn),因?yàn)閷<夜沧R(shí)指南確實(shí)有一部分是可以讓機(jī)器看懂并自動(dòng)判分的。這背后存在的矛盾點(diǎn)就是是否存在一個(gè)行業(yè)標(biāo)準(zhǔn)且真正有用的數(shù)據(jù)庫。目前的公共疾病數(shù)據(jù)庫錄入信息標(biāo)準(zhǔn)各異、所包含的數(shù)據(jù)大多都是基于歐美人種的研究,并不能完全適用于特定人種,而且缺乏基因組學(xué)數(shù)據(jù)與表型數(shù)據(jù)的深度整合。
目前,所有基因檢測(cè)環(huán)節(jié)企業(yè)都在做一件事情——數(shù)據(jù)收集。公司通過收集、整合公共或者私有信息,經(jīng)過人工檢閱后匯總為數(shù)據(jù)庫或知識(shí)庫,很大程度上是希望通過形成足夠大規(guī)模的普通人數(shù)據(jù)庫,矯正目前數(shù)據(jù)解讀可能存在的一系列偏差。這是很有價(jià)值的基礎(chǔ)工作,但凡在基因組學(xué)領(lǐng)域發(fā)展迅速的國家,很早之前就開始了這樣的基礎(chǔ)建設(shè)工作,比如英國和美國。
2015年8月貝瑞和康正式啟動(dòng)“神州基因組數(shù)據(jù)云”項(xiàng)目,該項(xiàng)目由貝瑞和康和阿里云共同參與建設(shè),旨在打造以海量中國人群基因組數(shù)據(jù)為核心的數(shù)據(jù)云,實(shí)現(xiàn)對(duì)個(gè)人基因組數(shù)據(jù)的精準(zhǔn)解讀。2016年9月,貝瑞和康對(duì)外公布了“神州基因數(shù)據(jù)云”項(xiàng)目階段性重要成果,完成世界首個(gè)中國人群基因組數(shù)據(jù)庫建設(shè),填補(bǔ)了國際基因數(shù)據(jù)庫中缺少中國人群特有基因組數(shù)據(jù)信息的空白。
2016年9月,華大深圳國家基因庫正式開業(yè),這是我國唯一一個(gè)獲批籌建的國家基因庫?;驇斓臄?shù)據(jù)庫、樣本庫、活體庫,以及規(guī)劃數(shù)據(jù)能力均超越國際三大基因數(shù)據(jù)中心,綜合能力位居世界第一,成為我國首個(gè)國家級(jí)基因數(shù)據(jù)中心。
此外,還有多家中游檢測(cè)企業(yè)正在籌備基因庫的相關(guān)籌建工作。2015年7月,海普洛斯聯(lián)合深圳市人民醫(yī)院發(fā)起并推出了一項(xiàng) “萬人癌癥基因測(cè)序計(jì)劃”。據(jù)悉,已有 30 多家全國頂級(jí)的醫(yī)院或科室加盟 “萬人癌癥基因測(cè)序計(jì)劃”,并且已經(jīng)完成了將近 5000 例腫瘤患者或高危人群的基因檢測(cè)。
2016年7月,由暨南大學(xué)主導(dǎo),未來組參與完成的第一個(gè)亞洲人參考基因組“華夏一號(hào)”在線發(fā)表于Nature Communications雜志。該研究以暨南大學(xué)為主導(dǎo),由南加州大學(xué)、華盛頓大學(xué)、俄亥俄州立大學(xué)、美國國立衛(wèi)生研究院生物技術(shù)信息中心、武漢生物技術(shù)研究院、未來組、哥倫比亞大學(xué)、貝勒醫(yī)學(xué)院、冷泉港實(shí)驗(yàn)室等多家科研單位共同合作完成。“華夏一號(hào)”的發(fā)布,表明國內(nèi)科研團(tuán)隊(duì)在第三代測(cè)序領(lǐng)域已經(jīng)進(jìn)入世界前沿,并填補(bǔ)了中國人群的疾病研究缺少精細(xì)參考基因組的不足。
隨著基因測(cè)序成為國家健康醫(yī)療大數(shù)據(jù)戰(zhàn)略的主要內(nèi)容之一,“華夏一號(hào)”將成為推進(jìn)臨床和科研大數(shù)據(jù)應(yīng)用的重要基礎(chǔ)性工作,大力推動(dòng)中國的遺傳疾病研究與診斷的發(fā)展。
其實(shí)目前幾乎所有的中游測(cè)序企業(yè)都在進(jìn)行基因組學(xué)數(shù)據(jù)的收集工作,但對(duì)于公司來說,要形成規(guī)模足夠大的基因數(shù)據(jù)庫,則還需要時(shí)間的醞釀。另外,數(shù)據(jù)規(guī)模達(dá)到一定量級(jí)后,企業(yè)是否會(huì)共享,直接影響到數(shù)據(jù)庫是否廣泛使用,這也許還需要政府層面的布局。
結(jié)語:數(shù)據(jù)庫是基礎(chǔ),云端分析成為趨勢(shì)
宏觀層面來講,大多數(shù)企業(yè)都還是A輪或者A輪以前的初創(chuàng)公司,可以說市場(chǎng)還屬于醞釀階段。而像其明生物、百邁客、安諾優(yōu)達(dá)這些比較成熟的企業(yè)先后進(jìn)入市場(chǎng),似乎也代表著行業(yè)趨勢(shì)(尤其是云平臺(tái))。
從產(chǎn)品分布來看,基于分析軟件和分析系統(tǒng)的傳統(tǒng)分析手段的企業(yè)比較多,但面對(duì)如今激增的數(shù)據(jù)規(guī)模,這些手段很難實(shí)現(xiàn)絕對(duì)意義上的突破性。而PaaS、SaaS等云技術(shù)手段,通過將數(shù)據(jù)分析流程轉(zhuǎn)移到云上,很大程度減輕數(shù)據(jù)處理環(huán)節(jié)的負(fù)重(無論是硬件上的實(shí)質(zhì)負(fù)重,還是處理速度上的心理負(fù)重)。
但這些產(chǎn)品大部分都是聚焦在數(shù)據(jù)分析環(huán)節(jié),由于人類大多數(shù)疾病是多個(gè)基因的共同作用結(jié)果,涉及到多個(gè)基因的變量表達(dá)。這些數(shù)據(jù)的解讀必須要考慮到多個(gè)基因多個(gè)變量因素,因此這個(gè)環(huán)節(jié)背后必須要有一個(gè)強(qiáng)大可用的數(shù)據(jù)庫支持。在此基礎(chǔ)上,再利用技術(shù)手段,尋求可自動(dòng)化,可替代人工的渠道,以節(jié)省時(shí)間和成本,也許不失為一種可行方案。
在國家發(fā)展改革委正式印發(fā)《“十三五”生物產(chǎn)業(yè)發(fā)展規(guī)劃》中,基因檢測(cè)、細(xì)胞治療、免疫治療、基因編輯、產(chǎn)前篩查等多個(gè)熱門概念被“點(diǎn)名”?!兑?guī)劃》在發(fā)展目標(biāo)中提到,要實(shí)現(xiàn)基因檢測(cè)能力(含孕前、產(chǎn)前、新生兒)覆蓋出生人口 50% 以上。借著產(chǎn)前檢測(cè)的東風(fēng),基因檢測(cè)概念將被更廣泛為的人群認(rèn)識(shí)和接受,再加之成本控制上的持續(xù)突破,未來或許還有望實(shí)現(xiàn)人人普及。而如論是無創(chuàng)產(chǎn)前還是腫瘤檢測(cè),還是全基因組檢測(cè),數(shù)據(jù)分析和解讀都將伴隨整個(gè)過程,測(cè)序的普及勢(shì)必將帶動(dòng)數(shù)據(jù)處理環(huán)節(jié)的發(fā)展。面對(duì)步步逼近的數(shù)據(jù)洪流,一場(chǎng)數(shù)據(jù)大戰(zhàn)即將打響。
來源:動(dòng)脈網(wǎng)