作者:亞峰發(fā)布日期:2019-05-22
“深度學習正走向兩極化,大部分研究深度學習的人員會偏向于工程化,包括建立更加全面、便捷、快速、可視化的深度學習平臺,'暴力'地將深度學習應用到更加多的領域。小部分的深度學習研究者會偏向于理論化,解決深度學習的理論瓶頸包括可解釋性等問題。”
密歇根州立大學湯繼良教授曾如此總結到。
醫(yī)療AI熱潮,無疑離不開這波深度學習的發(fā)展,但由于深度學習的天然局限性和醫(yī)療領域的特殊性,使得醫(yī)療AI這一交叉的領域,也在進入瓶頸期。
隨著深度學習即將觸及天花板,醫(yī)學影像分析科研人員也隨之分為兩大派別:理論派和工程派。
理論派的初衷,是解決深度學習“短缺”的部分,強調人工設計和數學論證,通過預先構建先驗知識,在不過度依賴大數據的前提下,開發(fā)出一個可解釋的、高精度、可解決諸多長尾問題的“智能模型”。不少專家認為,醫(yī)療AI中有大量Mission Critical和長尾問題,這對研究人員的整體系統設計能力要求非常高,因此人的作用就顯得尤為重要,而基于黑箱統計模型的深度學習,顯然存在太多的弊病。
工程派的做法,則是進一步發(fā)揮深度學習自身的優(yōu)勢,揚長避短,獲取更多標注數據,設置更多參數,用更強大的算力,訓練出一個能夠學習更多維度特征的“經驗模型”。其本質是建立某種學習和搜索的meta Method,依靠摩爾定律帶來的指數增長的算力,讓機器自行構建復雜的知識系統。
前者強調人工設計,后者依靠機器自主構建。
后深度學習時代的醫(yī)療AI研究走向,正朝著這兩個看似極端的方向發(fā)展,工者愈工,理者愈理。
前者的難度在于理論的突破,從某種程度上取決于個別人的開創(chuàng)性研究成果;而后者在很大程度上取決于整個行業(yè)的數據標準化、開放化和監(jiān)管進度。
二者雖殊途,但目的是同歸。
深度學習+醫(yī)學影像的瓶頸
電子科技大學教授李純明曾在接受雷鋒網(公眾號:雷鋒網)AI掘金志采訪時談到,深度學習吸引人的地方在于,原則上它在不同的應用中均可以使用同樣的訓練算法框架。
只需替換訓練數據和相應的標注進行訓練,即可得出一個具有某種輸入輸出關系的多層神經網絡。
輸入一個數據,系統就輸出一個結果,應用過程可以做到全自動。
但這種看起來一勞永逸的框架,在實際應用中還有一些局限。
以醫(yī)學影像分析為例,由于醫(yī)學影像數據復雜多變,不同器械商的成像設備、不同的成像參數選擇、成像設備的更新換代等因素,都會導致圖像性質(如信噪比、分辨率和偽影等等)的變化,以及不同病人與病情的差異也會導致圖像特征的變化。
訓練數據如果不夠“大而全”,一旦遇到跟訓練數據有一定差異的數據,加入一點噪音,神經網絡輸出的結果可能就會出很大的錯誤。
但訓練數據要多“大”多“全”?也并未有一個客觀的量化標準。
深度學習需要用醫(yī)生手工標注的數據,還要求訓練數據和手工標注符合一定的標準。
但數據的標準化,還尚未提出通用的法則遵循。而在算法層,深度學習的調參也并沒有規(guī)律可循,調參難題至今未得到實質性解決。
這些都可能會給深度學習的應用帶來諸多不確定性,致使其在不同數據集上的性能可能會截然不同,魯棒性較差。
在醫(yī)療領域的應用上,深度學習的不可解釋性也是個無法回避的問題。
醫(yī)生和病人都很難接受這種不可解釋的診斷結果和治療方案,而當前工科會議的論文,基于不可解釋的深度學習研究成果幾乎是主流。
“數據驅動的深度學習只是數據處理的工具之一,它在醫(yī)療領域離真正的落地還有相當大的距離,還需在理論和技術上有所突破。學術界研究深度學習不應太工程化,應該多研究一些基礎性的理論問題,提出更有原創(chuàng)性的算法。”李純明談到。
“我認為,從眼前來講,不應該一窩蜂都用數據驅動的深度學習。一些醫(yī)學圖像算法的開發(fā)也應該針對不同的應用,去設計不同的算法,開發(fā)者盡可能在算法中融入領域知識,設計出針對特定應用的個性化的方法,而不是對每個病種都在TensorFlow或Pytorch等開源框架上用不同的數據進行訓練和調參。由于深度學習這種數據驅動的學習過程,是一種較少利用領域知識的機制,因此技術的開發(fā)也就幾乎不需要開發(fā)者與醫(yī)生的交流。醫(yī)生在技術開發(fā)的過程中只起到了對訓練數據手工標注的作用,也就是說醫(yī)生被當作人工智能背后的‘標注工人’來用。”
“從長期來講,數據為王的醫(yī)學影像AI研究方法,在未來遇到的問題將會越來越多。當前多數學者更多停留在簡單的工程問題,缺乏在基礎研究上的突破性進展,企業(yè)界的技術開發(fā)也因此遭遇瓶頸。”
與此同時,現在的深度學習其實是一個有問題的框架,用大量標注數據做訓練的方法,在過去幾年很成功,但在解決醫(yī)療這類擁有諸多“非封閉”和”長尾”問題的領域,當前的深度學習主流研究,并不代表是正確的方向。
現階段,計算機視覺系統是一個Training System,而不是一個Learning System,我們需要從Training System變成Learning System,讓機器主動,并結合數據的結構、時間空間結構去學習,而不是被動地用人工訓練來標注它。
目前行業(yè)走的是粗放型發(fā)展路線,是靠堆積數據和計算資源來換取高性能,這是資源而不是效率的競賽。在大家把醫(yī)學影像分析聚焦于Data Set的大環(huán)境下,雖然在工業(yè)界已有一定的成果,但理論派認為,原創(chuàng)性技術和基礎研究,更值得工科人去關注和投入。
AI理論創(chuàng)新之外的解決方法
正是由于深度學習遭遇的種種問題,也促使優(yōu)秀科學家加大了對基礎理論的研究。
而另一方面,在部分臨床問題中,也可通過在非技術層的行業(yè)標準構建等方法,來逐步推動醫(yī)學影像AI輔助診斷的發(fā)展。
第一步,則需定義好要解決的問題。
上海長征醫(yī)院影像醫(yī)學與核醫(yī)學科主任劉士遠在2018中國醫(yī)學人工智能大會的演講中指出,現在的AI醫(yī)療產品遇到的首個問題便是實用性差,如現在常見的影像AI產品大多是基于單病種圖像標注形成的模型,尚未符合臨床實用場景的產品,而且大多數產品性能的自報數據與實際檢測數據不符,魯棒性有待提高。
AI產品往往只是集中在少數幾個病種,難以覆蓋全部醫(yī)學影像問題。
其次,行業(yè)現在普遍缺乏標準化高質量的訓練數據,國內外雖然有很多公開的數據庫,但是存在同質化和人種差異等問題。
而且眾多人工智能企業(yè)和機構采用的訓練數據集標準多樣,系統偏差較大,行業(yè)缺乏醫(yī)學圖像和疾病征像的統一認識。
整個行業(yè)的醫(yī)療數據保護和監(jiān)管措施也有一定的缺失,數據不能被溯源,缺乏合法性和可分享性。
同時業(yè)內也缺乏對數據使用標準的判斷依據,在現有的法律基礎上尋找合規(guī)使用和分享數據的渠道,也是迫在眉睫的一件事情。
劉士遠建議到,構建標準庫,離不開醫(yī)生的參與。
要形成與AI研發(fā)相關的標準和數據,需要在圖像采集環(huán)節(jié)、標準庫構建環(huán)節(jié)、病種的分布以及各種描述術語等層面,都要達成一定的共識。
2018年9月,國家頒布了《國家健康醫(yī)療大數據標準、安全和服務管理辦法(試行)》。此外,在肺結節(jié)領域,中檢院肺結節(jié)AI檢驗數據庫標定專家組已經完成肺結節(jié)標準數據集建設。
這些均為標準的建設,做好了鋪墊。
當然,圖像標注環(huán)節(jié)也存在很多問題,以肺結節(jié)標注過程為例,其主要存在以下問題:標注者隊伍混亂,資質不一;圖像征象認識不統一;圖像標注方法不統一;圖像分割方法不統一;圖像量化方法不統一。
據了解,中檢院在構建肺結節(jié)標準庫的過程中,從全國招了250名5年以上經驗的影像科醫(yī)生志愿者,對他們進行了簡單的測試,使用了30例結節(jié),結果準確率只有30%,說明如果沒有共識和基礎培訓,醫(yī)生的標注準確率很低,非影像科醫(yī)生甚至不是醫(yī)生的準確率更難以想象。
而標注的方式,有緊密包裹法、區(qū)域標注法等,不同的標注方法輸出的結果也不盡相同。
“圖像分割如果沒有統一的標準,結論的差別也會非常巨大。
還有量化的方法,到底是測直徑,還是測體積,還是測質量,怎么測,行業(yè)都需要形成一致意見。
在醫(yī)學影像AI模型檢測階段,也會存在生產過程不規(guī)范,模型效果和安全性缺乏公正評價,缺乏產品檢測標準庫和評價體系,缺乏相關法律法規(guī)、質控檢查和管理制度等問題。
在AI模型使用階段,受歡迎程度,對醫(yī)生的影響,過多的假陽性,倫理和法規(guī),是否匹配醫(yī)院和醫(yī)生的需求等問題也尚待解決。”
另外,也需考慮其他問題:
產品應游離于信息系統之外,還是融合于信息系統之內?
年輕醫(yī)生對AI產品產生依賴之后,是否會導致業(yè)務能力下降?
數據的倫理和產品的倫理問題:數據的倫理就是數據的所有權、許可權和隱私權都需要制定規(guī)范,現在衛(wèi)計委已經發(fā)布了相關標準和規(guī)范。第二個則是產品的倫理問題,隨著產品的逐漸落地,產品的責任和影響都需要倫理的相關準則來考慮。
劉士遠教授還強調,影像診斷是全鏈條、多維度的工作,工作內容不僅僅是圖像識別,需要充分發(fā)揮醫(yī)生在醫(yī)學影像AI研發(fā)過程中的作用。
在數據上,醫(yī)生可以建立大樣本的單病種數據庫,提高訓練數據質量,并在此基礎上規(guī)范化標注,形成高質量訓練集,還要學會在法律法規(guī)下分享和使用數據。
醫(yī)生還應當成為質量控制和標準的制定者和執(zhí)行者。如制定圖像采集和圖像質量的標準,制定數據庫建設的構成比例、病種分布、病灶類型等專家共識,并形成各單病種影像征象和描寫屬于以及單病種AI模型數據標記專家共識。建立一套正確的基本倫理準則來指導AI的設計、管理和應用。
醫(yī)學影像AI的未來
無論是AI理論創(chuàng)新,或是非理論層的行業(yè)標準建立,其均是醫(yī)學影像AI成功的必備條件。
2019年7月13日,由中國計算機學會、雷鋒網、香港中文大學(深圳)聯合舉辦的CCF-GAIR全球人工智能與機器人峰會,將開設“AI醫(yī)療”論壇。
本論壇以“后深度學習時代的醫(yī)療AI”為主題,邀請全球最具代表性的理論派、工程派專家以及知名企業(yè)家,在大會上分享最新醫(yī)工交叉與產學融合研究成果與應用案例。
目前,計算機視覺與醫(yī)學影像分析界泰斗級人物Demetri Terzopoulos院士已確認出席,與此同時,雷鋒網也在邀請世界級醫(yī)療集團高管,CVPR、MICCAI等頂會主席參會。
在上一屆CCF-GAIR的醫(yī)療論壇中,中科院自動化所研究員田捷、飛利浦中國CTO王熙、MICCAI大會主席沈定剛、微軟亞洲研究院副院長張益肇、美國科學院候選院士邢磊等專家均針對2018年醫(yī)療AI遇到的難題,提出了自己的見解。
2019年7月13日,我們將進一步揭開“后深度學習時代”醫(yī)療AI的走向。
來源:雷鋒網