版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

血常規(guī)、尿檢等指標(biāo)就能識(shí)別卵巢癌!中山大學(xué)劉繼紅團(tuán)隊(duì)牽頭,四大醫(yī)學(xué)院聯(lián)合構(gòu)建 AI 融合模型

HyperAI超神經(jīng)
原創(chuàng)
人工智能說(shuō)明書,了解 AI 的功效和副作用。
收藏

根據(jù)國(guó)家衛(wèi)生健康委員會(huì)發(fā)布的《卵巢癌診療指南(2022 版)》,我國(guó)卵巢癌年發(fā)病率居女性生殖系統(tǒng)腫瘤第 3 位,僅次于子宮頸癌和子宮體惡性腫瘤,病死率位于女性生殖道惡性腫瘤之首,其 5 年生存率與診斷時(shí)的病程階段密切相關(guān)。根據(jù)美國(guó)國(guó)家癌癥研究所發(fā)布的數(shù)據(jù),在早期的局部感染階段,卵巢癌 5 年生存率為 92.4% ,而轉(zhuǎn)移階段 5 年存活率則下降至 31.5%。

卵巢深處盆腔,卵巢病變處于早期時(shí)常無(wú)特異臨床癥狀,因出現(xiàn)癥狀就診時(shí),70% 的患者已處于晚期。因此卵巢癌的早期診斷具有重大意義。

卵巢癌不同階段的 5 年生存率

近日,中山大學(xué)腫瘤防治中心婦科劉繼紅教授團(tuán)隊(duì),聯(lián)合南方醫(yī)科大學(xué)、華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬同濟(jì)醫(yī)院、浙江大學(xué)醫(yī)學(xué)院附屬婦產(chǎn)科醫(yī)院,針對(duì)卵巢癌目前早期診斷困難、缺乏有效腫瘤標(biāo)志物的困境,構(gòu)建了卵巢癌診斷人工智能融合模型 MCF,輸入常規(guī)實(shí)驗(yàn)室檢驗(yàn)數(shù)據(jù)和年齡即可計(jì)算卵巢癌的患病風(fēng)險(xiǎn)。相關(guān)成果已發(fā)表于《柳葉刀·數(shù)字健康》(The Lancet Digital Health)。

研究亮點(diǎn):

* 該研究收集了我國(guó) 3 家醫(yī)院的數(shù)據(jù),并使用基于多標(biāo)準(zhǔn)決策的分類融合 (MCF) 框架來(lái)開(kāi)發(fā)模型

* 該模型識(shí)別卵巢癌的準(zhǔn)確率優(yōu)于 CA125 和 HE4 等傳統(tǒng)生物標(biāo)志物

* 該研究證明了低成本、易獲得的常規(guī)實(shí)驗(yàn)室檢測(cè),具備成為有效卵巢癌診斷工具的潛力

匯集 3 家醫(yī)院、1 萬(wàn)名患者、98 項(xiàng)相關(guān)檢查及數(shù)據(jù)
研究人員收集了 2012 年 1 月 1 日至 2021 年 4 月 4 日期間,中山大學(xué)腫瘤防治中心、華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬同濟(jì)醫(yī)院、浙江大學(xué)醫(yī)學(xué)院附屬婦產(chǎn)科醫(yī)院內(nèi),超過(guò) 1 萬(wàn)例患者(卵巢癌及子宮附件良性病變/正常體檢女性患者)的 98 項(xiàng)實(shí)驗(yàn)室檢查和臨床特征數(shù)據(jù)。

其中,華中科技大學(xué)同濟(jì)醫(yī)學(xué)院參與者(共 3,007 人)的數(shù)據(jù)被選為訓(xùn)練集,并在該訓(xùn)練集上進(jìn)行了五倍交叉驗(yàn)證。兩個(gè)外部驗(yàn)證集分別來(lái)自浙江大學(xué)醫(yī)學(xué)院婦女醫(yī)院(共 5,641 人)和中山大學(xué)腫瘤中心(共 2,344 人)。

MCF:融合 20 個(gè)基礎(chǔ)分類模型

研究流程圖

該研究招募了我國(guó) 3 個(gè)不同地區(qū)的大量參與者。3 個(gè)隊(duì)列中卵巢癌診斷的中位年齡為 51-56 歲。然而,大規(guī)模數(shù)據(jù)也帶來(lái)了一些問(wèn)題。例如,多中心數(shù)據(jù)是異質(zhì)的,不利于構(gòu)建穩(wěn)健的人工智能模型,并且存在一些缺陷,包括卵巢癌患者和對(duì)照參與者數(shù)量之間存在顯著不平衡,單位不一致,以及大量的缺失值(內(nèi)部驗(yàn)證集為 48.5%)。

為了解決這些數(shù)據(jù)問(wèn)題,確保模型的穩(wěn)健性,研究人員進(jìn)行了大量的數(shù)據(jù)清洗工作,包括:

* 構(gòu)建模型時(shí),將 98 項(xiàng)實(shí)驗(yàn)室檢測(cè)項(xiàng)目列為候選輸入特征。對(duì)于單位不同的實(shí)驗(yàn)室檢測(cè)項(xiàng)目,進(jìn)行了單位統(tǒng)一處理。

* 缺失數(shù)據(jù)通過(guò) MICE (multivariate imputation by chained equations) 算法進(jìn)行估算。

* 為了減少機(jī)構(gòu)間數(shù)據(jù)分布的差異,使用 Box-Cox 算法進(jìn)行了數(shù)據(jù)調(diào)和,然后通過(guò) min-max 標(biāo)準(zhǔn)化進(jìn)行了數(shù)據(jù)規(guī)范化處理。

* 為了解決數(shù)據(jù)不平衡問(wèn)題,采用了自適應(yīng)綜合采樣方法,平衡比例為 0.5。

此外,MCF 框架是該研究團(tuán)隊(duì)在先前工作中提出的 H-MCF(基于 MCF 的分層預(yù)測(cè)方案)的一個(gè)變體,研究人員建立了 176 個(gè)基礎(chǔ)分類模型,并結(jié)合了特征選擇方法 (feature selection method) 與機(jī)器學(xué)習(xí)分類器 (machine-learning classifier),通過(guò)五倍交叉驗(yàn)證,從 176 個(gè)模型中選出前 20 個(gè)基礎(chǔ)分類模型。其中 ,特征選擇過(guò)程將識(shí)別最重要的 20 個(gè)特征,供分類器使用以生成一個(gè)基礎(chǔ)分類模型。

隨后,研究人員根據(jù)多準(zhǔn)則決策理論 (multi-criterion decision-making) 估計(jì)每個(gè)模型的權(quán)重,最終融合其預(yù)測(cè)以達(dá)成一致性分類。

前 20 個(gè)基礎(chǔ)分類模型

模型性能顯著高于傳統(tǒng)方法
研究人員通過(guò) AUC、準(zhǔn)確性、特異性、敏感性、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值和 F1 分?jǐn)?shù),來(lái)量化 MCF 模型預(yù)測(cè)準(zhǔn)確性,結(jié)果如下圖所示:

研究人員從前 20 個(gè)基礎(chǔ)分類模型中選出的 52 個(gè)特征(51 項(xiàng)實(shí)驗(yàn)室檢驗(yàn)指標(biāo)和年齡),其中約 90% 的特征與卵巢癌的風(fēng)險(xiǎn)顯著相關(guān),并基于 SHAP(Shapley Additiveexplanation ,一種評(píng)估和解釋模型預(yù)測(cè)的技術(shù))構(gòu)建了類似的一致性特征排名。單個(gè)特征的預(yù)測(cè) AUC 范圍為 0.477 (AFP) 至 0.886 (CA125),并且總體上與它們的排名一致。

其中,51 項(xiàng)實(shí)驗(yàn)室檢驗(yàn)指標(biāo)包含了常規(guī)血液檢查、尿檢、生化檢查等,例如血小板 PLT、纖維蛋白原測(cè)定 FIB、評(píng)定炎癥程度的指標(biāo) CRP、測(cè)定血清白蛋白水平的 ALB、紅細(xì)胞沉降率 ESR、尿 ph 值等。下圖 A 為檢驗(yàn)指標(biāo)的重要性排序。

特征排名及相關(guān)分析

MCF 在內(nèi)部驗(yàn)證集和兩個(gè)獨(dú)立的外部驗(yàn)證集上的 AUC 分別達(dá) 0.949 (95%CI 0.948-0.950)、0.882 (0.880-0.885) 和 0.884 (0.882-0.887)。

研究人員還將 MCF 與卵巢癌檢測(cè)中的傳統(tǒng)腫瘤標(biāo)志物進(jìn)行了比較。對(duì)于區(qū)分卵巢癌的所有 3 個(gè)驗(yàn)證集,MCF 的 AUC、敏感性和 F1 評(píng)分均高于傳統(tǒng)腫瘤標(biāo)志物,如下圖所示:

對(duì)于晚期卵巢癌與對(duì)照組的分類,MCF 在內(nèi)部驗(yàn)證集中的 AUC 為 0.985;第一個(gè)外部驗(yàn)證集達(dá)到 0.972,第二個(gè)外部驗(yàn)證集達(dá)到 0.943。對(duì)于早期卵巢癌癥與對(duì)照組的分類,MCF 在內(nèi)部驗(yàn)證集中的 AUC 為 0.879,在第一和第二外部驗(yàn)證集中分別為 0.823 和 0.810。

研究結(jié)果顯示,MCF 模型識(shí)別卵巢癌患者、特別是早期卵巢癌患者的 AUC 和靈敏度顯著高于傳統(tǒng)卵巢癌標(biāo)志物 CA125、HE4 及兩者聯(lián)合,且在部分指標(biāo)缺失的人群中依然可以對(duì)卵巢癌的風(fēng)險(xiǎn)進(jìn)行較準(zhǔn)確的預(yù)測(cè),這表明 MCF 模型具有較好的穩(wěn)定性,并對(duì)真實(shí)世界數(shù)據(jù)具有較好的兼容性。

此外,本研究還發(fā)現(xiàn),除腫瘤標(biāo)志物外,其他常規(guī)實(shí)驗(yàn)室檢驗(yàn),如 D-D二聚體、血小板計(jì)數(shù)等,也對(duì)卵巢癌診斷預(yù)測(cè)有較大貢獻(xiàn),提示這些檢驗(yàn)指標(biāo)相關(guān)病理生理過(guò)程可能在卵巢癌的發(fā)展過(guò)程中發(fā)揮了重要作用,其潛在機(jī)制值得進(jìn)一步探討。

AI 賦能基層醫(yī)療發(fā)展

根據(jù)「2022 年我國(guó)衛(wèi)生健康事業(yè)發(fā)展統(tǒng)計(jì)公報(bào)」,盡管我國(guó)基層醫(yī)療衛(wèi)生機(jī)構(gòu)達(dá)到 979,768 個(gè),占全國(guó)醫(yī)療衛(wèi)生機(jī)構(gòu)總數(shù)的 94.85%,但就診療量而言,基層醫(yī)療衛(wèi)生機(jī)構(gòu)診療量 42.7 億人次,僅占全年總診療量的 50.7%??梢钥闯?,我國(guó)基層醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)量占比較高,但診療量仍有較大上升空間。

此外據(jù)國(guó)家癌癥中心的數(shù)據(jù)統(tǒng)計(jì),在我國(guó)腫瘤醫(yī)療服務(wù)市場(chǎng),公立三甲醫(yī)院承擔(dān)了超過(guò) 80% 的腫瘤治療任務(wù)。這些三甲醫(yī)院大多分布在省會(huì)城市,卻要同時(shí)接待來(lái)自四面八方的患者,醫(yī)生的壓力可想而知。

但近些年人工智能的成熟應(yīng)用給醫(yī)療行業(yè)帶來(lái)了無(wú)限遐想,也為基層就診提供了新思路。本研究構(gòu)建的卵巢癌診斷模型 MCF 已開(kāi)源,輸入相應(yīng)實(shí)驗(yàn)室檢驗(yàn)數(shù)據(jù)和年齡即可計(jì)算患卵巢癌的風(fēng)險(xiǎn)值,無(wú)疑為該模型在基層醫(yī)療機(jī)構(gòu)的普及提供了重要助力。

人工智能輔助診斷在基層衛(wèi)生機(jī)構(gòu)的配置至關(guān)重要,國(guó)務(wù)院此前印發(fā)的「關(guān)于進(jìn)一步深化改革促進(jìn)鄉(xiāng)村醫(yī)療衛(wèi)生體系健康發(fā)展的意見(jiàn)」中也提到,要加快推動(dòng)人工智能輔助診斷在鄉(xiāng)村醫(yī)療衛(wèi)生機(jī)構(gòu)的配置應(yīng)用。

人工智能應(yīng)用于基層衛(wèi)生機(jī)構(gòu),不僅可以將醫(yī)療信息處理為結(jié)構(gòu)化數(shù)據(jù),解決「數(shù)據(jù)孤島」和數(shù)據(jù)質(zhì)量問(wèn)題,為區(qū)域內(nèi)的醫(yī)療信息互聯(lián)共享打下基礎(chǔ);還能通過(guò)輔助問(wèn)診、輔助診斷、慢病管理等功能,提高基層診療水平,降低漏診、誤診概率,讓更多地方享受到高質(zhì)量的診斷和治療。

參考資料:

1.https://www.sysu.edu.cn/news/info/2331/1091611.htm

評(píng)論
自定義微笑
少傅級(jí)
閱讀
2024-04-11
北郊社區(qū)居委會(huì)狄莉
學(xué)士級(jí)
2024-04-11
O一網(wǎng)情深O
學(xué)士級(jí)
已學(xué)習(xí)
2024-04-11