-
華中科大AI模型預(yù)測新冠生存率準確率90%,有助早期介入
最后更新: 2020-03-19 17:16:13當(dāng)?shù)貢r間3月17日,醫(yī)藥學(xué)預(yù)印本平臺medRxiv發(fā)布了一項題為“A machine learning-based model for survival prediction in patients with severe COVID-19 infection”(未經(jīng)同行審議)的研究成果。這項由29名科學(xué)家共同進行的研究利用了最新的可解釋機器學(xué)習(xí)算法,對預(yù)測COVID-19(新冠肺炎)患者存活率的生物標志物進行了揭示,并有望加強對新冠高?;颊叩脑缙诟深A(yù),降低死亡率。
研究團隊來自華中科技大學(xué)同濟醫(yī)學(xué)院附屬同濟醫(yī)院、華中科技大學(xué)人工智能與自動化學(xué)院、劍橋大學(xué)植物科學(xué)學(xué)院等。文章的通訊作者為華中科技大學(xué)人工智能與自動化學(xué)院教授袁燁、同濟醫(yī)院麻醉科徐卉以及急診(重癥)醫(yī)學(xué)科科主任李樹生。
研究人員對武漢同濟醫(yī)院收治的404例COVID-19感染患者進行血液樣本數(shù)據(jù)收集并進行回顧性分析。通過機器學(xué)習(xí)工具,研究團隊最終選擇了3種生物標志物來預(yù)測個體患者的生存率,準確性超過90%:LDH(乳酸脫氫酶)、淋巴細胞和hs-CRP(超敏C-反應(yīng)蛋白)。
特別是,僅LDH水平較高這一項指標就能夠用于區(qū)分絕大多數(shù)需要立即就醫(yī)的病例。研究者們表示,這一發(fā)現(xiàn)與當(dāng)前醫(yī)學(xué)知識一致,即高LDH水平與各種疾?。òǚ尾考膊。绶窝祝┲邪l(fā)生的組織分解有關(guān)。
在當(dāng)前階段,對疾病的嚴重程度進行快速、準確和早期的臨床評估至關(guān)重要。然而目前,尚無確定的生物標志物作為標準,來區(qū)分需要立即就醫(yī)的患者。
此研究中,作者們運用最先進的機器學(xué)習(xí)框架,表明上述三種生物標記物可以準確預(yù)測疾病的嚴重程度,因此將大大減輕臨床參數(shù)監(jiān)測的壓力和其他相關(guān)的醫(yī)療負擔(dān)。
研究人員開發(fā)了基于XGBoost機器學(xué)習(xí)的預(yù)后模型,該模型使用患者最新一個血樣樣本能夠以90%以上的準確度預(yù)測COVID-19重癥患者是否存活;使用其他血液樣本則能達到90%的預(yù)測準確度。
該研究提出了一個簡單且可操作的公式,能夠?qū)π鹿诟呶;颊哌M行快速檢測、早期干預(yù)并有可能降低他們的死亡率。
研究樣本與模型訓(xùn)練
研究人員進行了分類任務(wù),將一般(general)、嚴重(severe)、危重(critical)患者的基本信息、癥狀、血液樣本、實驗室檢查結(jié)果(包括肝功能、腎臟功能、凝血功能、電解質(zhì)、發(fā)炎因子)輸入,并將它們與檢測時期結(jié)束時的臨床后果(存活或死亡)相對應(yīng)。
研究樣本是同濟醫(yī)院2020年1月10日至2月20日期間收集的404位患者的醫(yī)療信息。這404位患者中,有213位康復(fù),其余191位死亡,作者們表示,高死亡率與同濟醫(yī)院作為定點醫(yī)院,收治了最嚴重的病例有關(guān)。研究人員使用標準病例報告表收集病歷,其中包括流行病學(xué)、人口統(tǒng)計學(xué)、臨床、藥物、護理和死亡率等信息。
研究人員用375例患者信息進行算法開發(fā)(algorithm development),用29例作驗證集(validation)
研究人員將患者的數(shù)據(jù)分為訓(xùn)練集(training)、測試集(test)和其他驗證集(additional validation)。培訓(xùn)和測試集共計包含375名患者,而驗證集包括29名患者。訓(xùn)練和測試集的樣本數(shù)按照7:3的比例設(shè)置,再進行5次交叉驗證。
驗證集中的患者均為嚴重患者,因為就臨床結(jié)果而言,他們是最不可預(yù)測的。從臨床癥狀來看,發(fā)燒是最常見的初始癥狀(49.9%),其次是咳嗽(13.9%),疲勞(3.7%)和呼吸困難(2.1%)。375名患者的年齡分布為58.83±16.46歲,男性占58.7%。患者中有37.9%是武漢居民,家族聚集性病例占6.4%,醫(yī)療工作者占1.9%。
樣本患者的年齡、性別、流行病史等特點
盡管大多數(shù)患者在整個住院期間都采集了多個血液樣本,但模型訓(xùn)練和測試僅使用了患者最近一次的血樣記錄作為輸入,以得到評估疾病嚴重程度的關(guān)鍵生物標志物,區(qū)分需要立即醫(yī)療救助的患者以及準確匹配每個標簽的相應(yīng)功能。
患者3種生物標志物的中位數(shù)值,以及25和75的百分位值
與死亡風(fēng)險最相關(guān)的臨床特征
研究人員使用了一種名為XGBoost的分類器作為預(yù)測器模型,XGBoost是一種高性能的機器學(xué)習(xí)算法,由于其基于樹型(tree-based)方法的遞歸決策系統(tǒng),其具有巨大的可解釋性。模型的輸出對應(yīng)著患者的生存情況,研究人員將幸存的患者歸為0類,死亡的患者歸為1類。
研究人員沒有采用黑匣子建模(black-box modelling)策略的原因在于,其內(nèi)部模型機制通常很難解釋。在XGBoost中,每個單個功能的重要性取決于其在樹中每個決策步驟中的累積使用量。這樣就可以在其中得到一個度量標準,來表征每個特征的相對重要性,這對于評估模型結(jié)果中最具區(qū)別性的特征特別有價值,尤其是當(dāng)研究與臨床上的醫(yī)療參數(shù)有關(guān)時。
為了評估發(fā)生死亡風(fēng)險的標記,研究人員通過特征選擇過程評估了每個患者參數(shù)對算法決策的貢獻。XGBoost根據(jù)功能的重要性對功能進行了排名,該算法選擇了三個排名最靠前的臨床特征:LDH、淋巴細胞和hs-CRP,因此,它們被設(shè)置為關(guān)鍵特征。
根據(jù)其在多樹XGBoost算法中的重要性,研究人員對十大關(guān)鍵臨床特征進行了排名,LDH,淋巴細胞和hs-CRP排名前三
結(jié)果表明,該模型能夠準確預(yù)測患者的結(jié)局,而無需考慮入院時的最初診斷。
此外,附加驗證集的性能類似于訓(xùn)練和測試集的性能,這表明該模型捕獲了有關(guān)患者生存的關(guān)鍵生物標志物。同時,算法結(jié)果進一步強調(diào)了LDH作為患者生存率的關(guān)鍵生物標志物的重要性。
三大關(guān)鍵特征的訓(xùn)練/測試拆分和附加驗證集的模型性能,F(xiàn)1分數(shù)(F1-score)是算法精確率和召回率的調(diào)和平均數(shù),最大為1,最小為0
根據(jù)關(guān)于LDH,淋巴細胞和hs-CRP重要性的發(fā)現(xiàn),研究人員進一步構(gòu)建了簡化的且可在臨床上應(yīng)用的決策模型,即單個決策樹(single decision tree)。由于共有24例患者的三種主要生物標志物中至少有一種測量值不完整,研究人員利用剩下351例患者鑒定了單樹XGBoost模型。
簡單來說,就是研究人員選擇了模型中性能最佳的樹,使用三個關(guān)鍵特征及其閾值,可以預(yù)測病人死亡或是存活。
根據(jù)測試數(shù)據(jù)集選擇的性能最佳的樹及其準確性
這一模型顯示了100%的死亡預(yù)測精度和90%的生存預(yù)測精度??傮w而言,無論是多樹XGBoost還是單樹XGBoost模型,模型對于生存和死亡預(yù)測的準確性、宏觀和加權(quán)平均數(shù)的得分始終超過0.90。
最后,大多數(shù)患者在住院期間都接受了多次血液采樣。研究人員又通過上千份額外的血液測試結(jié)果對模型進行了驗證,發(fā)現(xiàn)預(yù)測準確度達到了90%。此外相關(guān)結(jié)果進一步表明該模型可以應(yīng)用于任何血液樣本,無論患者有怎樣的臨床結(jié)果。
提早識別高危患者,快速確定優(yōu)先級
研究者們表示,這項研究的意義是雙重的。首先,一般的相關(guān)研究只會“提供高風(fēng)險因素的范圍”,而這一模型則提供了一種簡單直觀的臨床測試,進而可以準確快速地量化死亡風(fēng)險。
如果醫(yī)生能夠提早知道,對于某些患者來說某些療法會導(dǎo)致治療效果不理想,那么醫(yī)生就能搶在病癥變得更嚴重之前采用不同的方法。應(yīng)用這一模型的目標是在不可逆性病變發(fā)生之前識別高危患者。
其次,任何一家醫(yī)院都可以輕松收集病人的LDH(乳酸脫氫酶)、淋巴細胞和hs-CRP(超敏C-反應(yīng)蛋白)這三個關(guān)鍵指標信息。在擁擠的醫(yī)院中醫(yī)療資源短缺的情況下,這種簡單的模型可以幫助快速確定患者的優(yōu)先級。
患者LDH水平的增加能夠反映組織或細胞的破壞,被認為是組織或細胞損傷的常見征兆。血清LDH已被確定為特發(fā)性肺纖維化(IPF)嚴重程度的重要生物標志物。
在患有嚴重肺間質(zhì)疾病的患者中,LDH的增加是顯著的,并且這是患者肺損傷最重要的預(yù)后指標之一。因此對于重癥COVID-19患者而言,LDH水平的升高表明肺損傷的嚴重程度增加。
研究團隊指出,較高的血清hs-CRP值也可用于預(yù)測嚴重COVID-19患者的死亡風(fēng)險。hs-CRP的增加是ARDS(急性呼吸窘迫綜合征)患者預(yù)后不良的重要標志,反映了炎癥的持續(xù)狀態(tài)。
值得注意的是,這種持續(xù)性炎癥反應(yīng)的結(jié)果可以從COVID-19死者的尸檢中看到,即肺部出現(xiàn)大量灰白色病變,在組織切片中,還可見肺泡溢出大量黏性分泌物。
最后,研究結(jié)果還表明淋巴細胞可能充當(dāng)潛在的治療靶標,這一假說得到了臨床研究結(jié)果的支持。此外,此前包括北京中日友好醫(yī)院呼吸科主任曹彬團隊在內(nèi)的研究者們已經(jīng)證明,淋巴細胞減少癥是COVID-19患者的常見特征,可能是與疾病嚴重程度和死亡率相關(guān)的關(guān)鍵因素。
與SARS和MERS患者的肺泡穿透和抗原呈遞細胞(APC)受損途徑一樣,新冠肺炎患者損傷的肺泡上皮細胞可以誘導(dǎo)淋巴細胞浸潤,導(dǎo)致持續(xù)性淋巴細胞減少。
此前的一項患者活檢研究表明,外周血CD4和CD8 T細胞的數(shù)量大大減少,而它們的狀態(tài)被過度激活。此外,也有研究表示淋巴細胞減少癥主要與CD4和CD8 T細胞的減少有關(guān)。因此,淋巴細胞可能在COVID-19中發(fā)揮著明顯的作用,這值得進一步研究。
作者們表示,這項研究同樣存在一定的局限性。首先,由于這一機器學(xué)習(xí)方法是純粹由數(shù)據(jù)驅(qū)動的,因此,如果從不同的數(shù)據(jù)集開始研究,則模型可能會有所不同。
此外,盡管作者們掌握了80多項臨床測量結(jié)果,但為了避免過擬合(overfitting),團隊采用的建模原理是在最少臨床測量結(jié)果數(shù)量和良好預(yù)測能力之間進行權(quán)衡,因此可能存在臨床測量結(jié)果不夠豐富的問題。
最后,這項研究在模型的可解釋性和更高的準確性之間進行平衡。盡管臨床環(huán)境傾向于使用可解釋的模型,但如果采用黑匣子模型,則準確性可能更高,但同時決策風(fēng)險更高。
從技術(shù)角度來看,作者們認為這項工作有助于使用機器學(xué)習(xí)方法為正在全球大規(guī)模暴發(fā)的COVID 19病例進行預(yù)測和診斷。
標簽 新冠病毒- 原標題:華中科大AI模型預(yù)測新冠生存率準確率90%,有助早期介入
- 責(zé)任編輯: 連政 
-
派億元消費券、領(lǐng)導(dǎo)帶頭“逛吃”,各地為刺激消費拼了
2020-03-19 17:09 新冠肺炎抗疫戰(zhàn) -
湖北省委書記呼吁全國:善待湖北人與湖北農(nóng)副產(chǎn)品
2020-03-19 16:01 新冠肺炎抗疫戰(zhàn) -
中國網(wǎng)友調(diào)侃特朗普,胡錫進用推特轉(zhuǎn)告了
2020-03-19 15:32 特朗普 -
防控生產(chǎn)兩手抓 習(xí)近平因時因勢再部署
2020-03-19 15:20 新冠肺炎抗疫戰(zhàn) -
外交習(xí)語 | 關(guān)于全球戰(zhàn)“疫”,習(xí)近平傳遞最新信息
2020-03-19 15:17 新冠肺炎抗疫戰(zhàn) -
阻止疫情跨國擴散 文旅部提醒充分評估出國旅游引發(fā)感染風(fēng)險
2020-03-19 15:10 新冠肺炎抗疫戰(zhàn) -
政策“組合拳”穩(wěn)住外貿(mào)基本盤
2020-03-19 15:10 中國經(jīng)濟 -
促消費回補全方位發(fā)力 更多政策利好將出
2020-03-19 15:10 中國經(jīng)濟 -
“全面禁食”標本兼治 中國力斬“野味產(chǎn)業(yè)”黑色鏈條
2020-03-19 15:06 新冠肺炎抗疫戰(zhàn) -
專家:新冠肺炎輕型普通型患者一般不會有后遺癥
2020-03-19 15:06 新冠肺炎抗疫戰(zhàn) -
青春閃亮最前線——走近ICU病房里的“90后”醫(yī)護人員
2020-03-19 15:02 新冠肺炎抗疫戰(zhàn) -
湖北:人員省內(nèi)流動除了健康碼之外不得附加其他條件
2020-03-19 15:01 新冠肺炎抗疫戰(zhàn) -
檢方提醒:在自家田里捕獵野生動物也違法
2020-03-19 15:00 依法治國 -
湖北0!
2020-03-19 14:59 新冠肺炎抗疫戰(zhàn) -
時政微視頻丨總書記指揮這場人民戰(zhàn)爭——凝心聚力
2020-03-19 14:51 新冠肺炎抗疫戰(zhàn) -
杭州西湖區(qū)回應(yīng)“美國女留學(xué)生硬闖小區(qū)”
2020-03-19 14:38 新冠肺炎抗疫戰(zhàn) -
好奇,中國怎么在疫情期間保障超市供應(yīng)穩(wěn)定?
2020-03-19 13:32 新冠肺炎抗疫戰(zhàn) -
廣東9例境外輸入病例,行動軌跡公布
2020-03-19 13:23 新冠肺炎抗疫戰(zhàn) -
武漢:居民可在無疫情小區(qū)內(nèi)非聚集性個人活動
2020-03-19 11:49 新冠肺炎抗疫戰(zhàn) -
甘肅5名公職人員私接境外人員回國被行拘
2020-03-19 11:03 依法治國
相關(guān)推薦 -
最新聞 Hot
-
美國發(fā)布首份AI備忘錄,“得防中國戰(zhàn)略突襲”
-
“英國軍情五處完全在胡說八道”
-
普京回應(yīng)“朝軍援俄”傳聞
-
被批“中國有支票美國有清單”,他又畫餅忽悠…
-
又嗆上了:野蠻人也好意思自詡捍衛(wèi)文明…
-
沒中國能成嗎?澳大利亞部長這么說
-
特朗普威脅襲擊莫斯科市中心?普京回應(yīng)
-
“我們目前世界領(lǐng)先,但中國人正敲開我們的大門”
-
“我不太喜歡談?wù)摳偁?,但我開的是小米”
-
盧卡申科評“朝軍援俄”:胡說八道,普京不是這性格
-
“不止美德,北約至少七國反對”
-
華裔老板拒絕“背書”哈里斯,加州第一大報編委辭職
-
英高級外交官搶、奪、撕...扎哈羅娃怒斥
-
連他都不敢說,“怕被特朗普報復(fù)”
-
134條!金磚通過《喀山宣言》,“將在聯(lián)合國分發(fā)”
-
“我們愿做一切符合中國利益的事”
-