發(fā)布日期:2017-10-31
癌癥,猶如黑暗中的魔鬼,帶給人們恐懼與絕望。而肺癌,在我國作為發(fā)病率、死亡率最高的一類癌癥,傷害著無數(shù)家庭。在我國每年都有近60萬人死于肺癌。然而,癌癥的死亡率與首次發(fā)現(xiàn)癌癥的時期緊密相關(guān),早期肺結(jié)節(jié)篩查可以為無數(shù)人免去痛苦與折磨。上海交通大學(xué)人工智能實驗室徐奕教授、倪冰冰教授、楊小康教授、朱禹萌同學(xué)等人與點內(nèi)科技合作,利用深度學(xué)習(xí)搭建的肺結(jié)節(jié)自動定位篩查系統(tǒng),能夠有效檢測肺 CT 影像中包含微小結(jié)節(jié)、磨玻璃等各類結(jié)節(jié),并降低假陽性誤診的發(fā)生,實現(xiàn)「早發(fā)現(xiàn),早診斷,早治療,早痊愈」的愿望。該算法獲得了天池大數(shù)據(jù)比賽的第一名,這個比賽吸引了全國兩千多支參賽團隊,總獎池高達百萬,面向全社會各大醫(yī)院、高校、公司、研究所參加。
團隊利用計算機視覺領(lǐng)域卷積神經(jīng)網(wǎng)絡(luò)技術(shù)來解決肺結(jié)節(jié)檢測問題,并在多個層面上進行創(chuàng)新。1)結(jié)合物體檢測與分割算法提取候選結(jié)節(jié),產(chǎn)生高召回率候選結(jié)節(jié)池。2)使用假陽性衰減網(wǎng)絡(luò),并采取多尺度集成學(xué)習(xí)的網(wǎng)絡(luò)模型提高檢測精度,衰減假陽性比例。3)在數(shù)據(jù)的處理上,采取生成對抗網(wǎng)絡(luò)進行了數(shù)據(jù)增廣,提高了訓(xùn)練的有效性。
算法框架如圖
數(shù)據(jù)預(yù)處理
通過旋轉(zhuǎn)平移等幾何變換針對有限數(shù)量的正樣本做數(shù)據(jù)多樣性增廣,類似于醫(yī)生通過不同的視角、不同的上下文去分析結(jié)節(jié)區(qū)域,并利用生成對抗網(wǎng)絡(luò)(GAN),從隨機噪聲中產(chǎn)生新的結(jié)節(jié)正樣本,學(xué)習(xí)生成新形態(tài)的結(jié)節(jié)樣本,深度增廣數(shù)據(jù)的多樣性,提升模型泛化能力。
結(jié)節(jié)預(yù)檢測
建立 3D-Unet 網(wǎng)絡(luò)結(jié)構(gòu),該分割網(wǎng)絡(luò)主要功能是提取疑似候選結(jié)節(jié),最大化敏感度,降低漏檢率。 其網(wǎng)絡(luò)輸入三個維度的數(shù)據(jù)特征,可從多個 Z 軸維度「觀察」,正如醫(yī)生結(jié)合多個平面觀察結(jié)節(jié),從而充分學(xué)習(xí)肺內(nèi)部正常紋理和非正常紋理的區(qū)別,捕捉到結(jié)節(jié)多樣性特征,比如毛玻璃結(jié)節(jié)密度比周圍略高、呈云霧狀性,純實性結(jié)節(jié)實性密度較高,類似單獨分離的蛋黃等。
結(jié)節(jié)精檢測
結(jié)節(jié)精檢測采用三種模型分別預(yù)測候選結(jié)節(jié)概率,并根據(jù)模型間權(quán)重比例給出最終概率的方法。主要優(yōu)勢在于,負(fù)樣本經(jīng)歷由易至難的學(xué)習(xí)過程,分割網(wǎng)絡(luò)和后續(xù)假陽性衰減網(wǎng)絡(luò)相輔相成。多結(jié)構(gòu)類型的模型 Ensemble,且單一網(wǎng)絡(luò)性能良好,類似于多個醫(yī)生獨立閱片的過程,綜合給出閱片結(jié)果。
結(jié)果
這一算法在阿里云與英特爾聯(lián)合舉辦的天池醫(yī)療 AI 大賽中大獲全勝,以 0.732 的成績從兩千多組強勁隊伍中脫穎而出,在比賽最為重要的復(fù)賽賽程中排名第一。
根據(jù)算法訓(xùn)練出的模型能夠更好地處理不同形態(tài)的結(jié)節(jié)特征,達到很好的檢測效果,在 400 例小結(jié)節(jié)測試數(shù)據(jù)上,F(xiàn)ROC 曲線如圖所示:
值得注意的是,該算法診斷 20 萬張肺結(jié)節(jié)片需要 10 分鐘,遠遠少于醫(yī)生人工診斷的時間,在提升準(zhǔn)確率的同時,節(jié)約了醫(yī)生的時間,真正在診斷流程上做好了醫(yī)生的助手。團隊也將算法真正投入到上海各大醫(yī)院進行試驗與使用,嵌入醫(yī)生診斷流程當(dāng)中,真正造福患者。
來源:機器之心(微信號 almosthuman2014)