商湯研究成果榮登國際權威期刊Nature子刊,生成式AI為醫療大模型迭代按下加速鍵
生成式人工智能近年來受到廣泛關注,作為人工智能的一個分支,其能夠模擬人類思維創造出新的內容,而不僅僅是分析或處理現有數據。近日,商湯科技聯合行業合作伙伴,結合生成式人工智能和醫療圖像數據的多中心聯邦學習發表的最新研究成果《通過分布式合成學習挖掘多中心異構醫療數據》(Mining Multi-Center Heterogeneous Medical Data with Distributed Synthetic Learning),登上國際頂級學術期刊《自然》(Nature)子刊《自然-通訊》(Nature Communications)。《自然-通訊》是一本完全開放獲取的綜合性期刊,發表自然科學各個領域的高質量研究成果,影響因子為16.6。
論文收錄結果公布
論文提出一個基于分布式合成對抗網絡的聯邦學習框架DSL(Distributed Synthetic Learning),可利用多中心的多樣性醫療圖像數據來聯合學習圖像數據的生成。該分布式框架通過學習得到一個圖像數據生成器,它可以更靈活地生成數據,這些生成數據可以替代多中心的真實數據,用于下游具體機器學習任務的訓練,并具備較強的可擴展性。
伴隨大模型的快速發展,Model as a Service(MaaS,模型即服務)概念也日漸興起。MaaS的大模型需要從海量的、多類型的數據中學習通用特征和規則,從而具備較強的泛化能力。DSL框架能夠在保護數據隱私的同時巧妙解決醫療大模型訓練中常見的數據量不足的瓶頸,可有效賦能MaaS的大模型訓練,為醫療大模型的開發迭代帶來重大突破。在這一技術的支撐下,商湯的“醫療大模型工廠”能夠幫助醫療機構更高效、高質量地訓練針對不同臨床問題的醫療大模型,使大模型在醫療領域的應用半徑得到進一步延伸。
兼顧隱私保護和數據共享
創新聯邦學習模式打造“數據生產工廠”
深度學習模型需要大量且多樣性的數據“喂養”,但醫療領域對用戶個人隱私保護有著極高的要求,這使得用于模型訓練的醫療數據,在多樣性和標注質量上都受到限制,也使多中心的醫療數據收集和醫療AI模型的開發迭代面臨較大的挑戰。
如何調和隱私保護和數據共享協作的矛盾?近幾年興起的“聯邦學習”提供了全新的解題思路。聯邦學習是一種分布式的機器學習方法, 可以在不共享數據的情況下對多中心的數據進行聯合建模,在保證數據安全的同時聯合學習某一特定應用模型。
與主流的聯邦學習模式不同的是,DSL框架的學習目標是數據生成器,而非具體應用的任務模型。該分布式架構由一個位于中央服務器的數據生成器和多個位于不同數據中心的數據鑒別器組成。在學習過程中,中央生成器負責生成“假”的圖像數據,并發送給各個數據中心,各個數據中心用本地的真實數據和收到的“假”數據進行對比后將結果回傳給中央服務器,并基于反饋結果訓練中央生成器生成更仿真的圖像數據。分布式的合成學習結束之后,中央生成器可以作為“數據生產工廠”,根據給定的約束條件(標注)生成高質量仿真圖像數據,從而得到一個由生成數據組成的數據庫。
該數據庫可以替代真實數據,用于下游具體任務的學習,使下游模型的更新迭代不再受到真實數據可訪問性的制約。同時,該方法通過分布式架構和聯邦學習方式保證中央服務器無需接觸數據中心的真實數據,也不需要同步各中心的鑒別器模型,有效保障了數據安全和隱私保護。
DSL框架包含一個中央生成器和多個分布式鑒別器,每個鑒別器位于一個醫療實體中
經過訓練的生成器可以作為“數據生產工廠”,為下游具體任務的學習構建數據庫
賦能MaaS新生態發展
為醫療大模型開發迭代按下加速鍵
DSL框架已通過多個具體應用的驗證,包括大腦多序列MRI圖像生成及下游的大腦腫瘤分割任務,心臟CTA圖像生成及下游的全心臟結構分割任務,多種器官的病理圖像生成及細胞核實例分割任務等。在可擴展性方面,該方法還可支持多模態數據中缺失模態數據的生成、持續學習等不同場景。
在瑞金醫院的展區,SenseCare?肝臟手術智能規劃系統憑借高效精準的病灶檢出、三維重建、手術規劃等功能,吸引不少觀眾駐足。從二維的肝臟CT影像,變為一目了然的三維立體模型,只需短短幾分鐘。輕輕拖動鼠標,就可在模型上自定義切面、角度、血管離斷位置等,幫助醫生幾分鐘內完成精準的肝臟手術規劃。
不同應用中生成數據示例:(a) 心臟CTA,(b) 大腦多模態MRI,(c) 病理圖像
生成的數據構成大數據庫可用于下游具體任務模型的學習,例如:(d) 全心分割,(e) 腦腫瘤分割,(f) 細胞核分割
DSL框架的構建,也有利于推動MaaS服務模式的發展。MaaS的醫療大模型在數據學習過程中,同樣會遇到醫療數據隱私安全保護的問題,而基于DSL框架,可以有效地從多中心多樣性數據中建立數據集倉庫,通過生成數據,在保障數據安全和隱私的同時為大模型的開發迭代提供創新思路。
細化到具體應用場景,DSL框架可助力醫療機構高效開展跨中心、跨地域模型訓練工作。不同區域醫療機構在疾病數據多樣性方面存在明顯的地域性差異,過去受限于數據安全和隱私保護的要求,使用跨中心醫療數據聯合訓練醫療模型難度較大。而借助DSL框架,有望幫助醫療機構更加高效便捷地開展跨中心醫療模型訓練。
在此前的世界人工智能大會(WAIC)上,商湯科技與行業伙伴合作,推出了醫療大語言模型、醫療影像大模型、生信大模型等多種垂類基礎模型群,覆蓋CT、MRI、超聲、內鏡、病理、醫學文本、生信數據等不同醫療數據模態。并展示了融入醫療大模型的升級版“SenseCare?智慧醫院”綜合解決方案,以及多個醫療大模型落地案例。借助商湯大裝置的超大算力和醫療基礎模型群的堅實基礎,商湯科技得以化身“醫療大模型工廠”,幫助醫療機構針對不同臨床問題高效訓練模型,甚至輔助機構實現模型自主訓練。
WAIC期間商湯科技展示了大模型在醫療領域的多個落地應用案例
隨著DSL框架的推出,醫療大模型的訓練將有望突破“數據孤島”的桎梏,一定程度上降低了醫療大模型的訓練門檻,有助于加速模型開發迭代,使醫療大模型的應用范圍得以進一步延伸,覆蓋更多臨床醫療問題。未來,商湯科技將持續聚焦醫療機構的多樣化需求,推動醫療大模型在更多醫療場景的落地,更好地助力醫院智慧化轉型及高質量發展,助力普惠醫療的實現。