日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

中國AI臨床診斷首次被Nature翻牌:71位專家巨獻(xiàn)準(zhǔn)確度超人類醫(yī)生

 qpalzmxmcbv 2019-02-13

中國AI臨床診斷首次被Nature翻牌:71位專家巨獻(xiàn)準(zhǔn)確度超人類醫(yī)生

【新智元導(dǎo)讀】中外71位科學(xué)家共同研發(fā)了一個(gè)AI系統(tǒng),可以像醫(yī)生一樣準(zhǔn)確地檢測(cè)出測(cè)試結(jié)果,診斷兒童疾病。準(zhǔn)確率方面始終與初級(jí)保健兒科醫(yī)生相當(dāng),甚至有所超越。這是中國研究團(tuán)隊(duì)首次在頂級(jí)醫(yī)學(xué)雜志發(fā)表有關(guān)NLP技術(shù)基于文本型電子病歷(EMR)做臨床智能診斷的研究成果!

我國研究人員再創(chuàng)佳績!

昨日,Nature子刊Medicine發(fā)布了一篇重磅文章——《使用人工智能評(píng)估和準(zhǔn)確診斷兒科疾病》,在業(yè)界引發(fā)了不小的反響。

中國AI臨床診斷首次被Nature翻牌:71位專家巨獻(xiàn)準(zhǔn)確度超人類醫(yī)生

這是中國研究團(tuán)隊(duì)首次在頂級(jí)醫(yī)學(xué)雜志發(fā)表有關(guān)自然語言處理(NLP)技術(shù)基于文本型電子病歷(EMR)做臨床智能診斷的研究成果!

這項(xiàng)人工智能程序,可以像醫(yī)生一樣準(zhǔn)確地檢測(cè)出測(cè)試結(jié)果、健康記錄甚至手寫筆記,診斷兒童疾病。

從流感、哮喘到威脅生命的肺炎和腦膜炎,該系統(tǒng)的準(zhǔn)確率始終與初級(jí)保健兒科醫(yī)生相當(dāng),甚至有所超越:

  • AI程序診斷出呼吸道感染和鼻竇炎準(zhǔn)確率為95%;
  • 不常見的疾病的確診率也很高:急性哮喘(97%)、細(xì)菌性腦膜炎和水痘(93%)以及單核細(xì)胞增多癥(90%)。

Nature雜志在一份新聞稿件中表示:

這項(xiàng)技術(shù)可能來的正是時(shí)候

。近年來,由于疾病的范圍、診斷測(cè)試和治療方案都呈指數(shù)級(jí)增長,這就使得醫(yī)生的決策過程變得更加復(fù)雜。

但是伯明翰大學(xué)工程學(xué)Duc Pham教授表示:

從結(jié)果來看,該系統(tǒng)的表現(xiàn)確實(shí)優(yōu)于初級(jí)醫(yī)生,但它絕對(duì)不能完全取代臨床醫(yī)生。無論使用多少訓(xùn)練樣例,都無法保證100%正確的結(jié)果。

本文的作者之一,張康教授也表示:“醫(yī)生和AI的關(guān)系,可以類比于人類駕駛員和在其監(jiān)督下的自動(dòng)駕駛汽車。它只會(huì)讓醫(yī)生在更短的時(shí)間內(nèi)以更低的成本做更好的事情?!?/p>

基于人工智能(AI)的方法已成改變醫(yī)療保健的有力工具

雖然機(jī)器學(xué)習(xí)分類器(MLCs)已經(jīng)在基于圖像的診斷中顯示出其強(qiáng)大的性能,但對(duì)各種大規(guī)模電子健康記錄(EHR)數(shù)據(jù)的分析仍然具有挑戰(zhàn)性。

在本文,作者表明MLC可以以類似于醫(yī)生使用的假設(shè) - 演繹推理的方式查詢EHR,并且發(fā)現(xiàn)以前的統(tǒng)計(jì)方法所沒有找到的關(guān)聯(lián)特性。作者的模型采用一種自動(dòng)化的自然語言處理系統(tǒng),使用深度學(xué)習(xí)技術(shù)從EHR中提取臨床相關(guān)信息。

本研究共分析了1362559名兒科患者就診于某大型轉(zhuǎn)診中心的10160萬個(gè)數(shù)據(jù)點(diǎn),對(duì)該框架進(jìn)行了訓(xùn)練和驗(yàn)證。

中國AI臨床診斷首次被Nature翻牌:71位專家巨獻(xiàn)準(zhǔn)確度超人類醫(yī)生

兒科診斷框架的工作流程圖

首先提取數(shù)據(jù),基于深度學(xué)習(xí)構(gòu)建NLP模型,對(duì)數(shù)據(jù)進(jìn)行語義分析,其次將數(shù)據(jù)進(jìn)行結(jié)構(gòu)化,最后對(duì)這些完全結(jié)構(gòu)化的數(shù)據(jù)庫用疾病分類器處理,預(yù)測(cè)臨床診斷。

中國AI臨床診斷首次被Nature翻牌:71位專家巨獻(xiàn)準(zhǔn)確度超人類醫(yī)生

大型兒科隊(duì)列中診斷框架的層次結(jié)構(gòu):使用分層邏輯回歸分類器,來建立基于解剖學(xué)劃分的診斷系統(tǒng)

基于器官的方法,首先將器官系統(tǒng)按照大類可以劃分為5類,分別是呼吸系統(tǒng)疾病、系統(tǒng)性全身性疾病、神經(jīng)精神疾病、泌尿生殖系統(tǒng)疾病、胃腸道疾病。然后將每個(gè)大類再細(xì)分成器官子系統(tǒng),甚至更具體的診斷組。

中國AI臨床診斷首次被Nature翻牌:71位專家巨獻(xiàn)準(zhǔn)確度超人類醫(yī)生

下劃線為計(jì)算機(jī)預(yù)測(cè)的診斷結(jié)果,醫(yī)生診斷顯示在頂部的第一行

在診斷層級(jí)的第一級(jí),分類器能準(zhǔn)確地辨別出,大量兒科患者的器官系統(tǒng)之間,存在哪些廣泛解剖學(xué)分類。接下來診斷層級(jí)的第二級(jí),我們拿呼吸系統(tǒng)疾病診斷舉例。

在呼吸系統(tǒng)疾病的診斷中,分類器可以辨別上呼吸狀況和下呼吸狀況。

在上呼吸道系統(tǒng)內(nèi),可以進(jìn)一步區(qū)分最常見的急性上呼吸道感染:鼻竇炎和喉炎,二者診斷準(zhǔn)確度均超過95%。

哮喘被歸類為呼吸系統(tǒng)中的一個(gè)獨(dú)立類別,診斷系統(tǒng)準(zhǔn)確地區(qū)分了無并發(fā)癥的哮喘、咳嗽變異性哮喘和急性哮喘急性發(fā)作。

人類醫(yī)生確診的315661次主要呼吸道疾病中,AI夠正確預(yù)測(cè)其中的295403例,精確度達(dá)到92%。

中國AI臨床診斷首次被Nature翻牌:71位專家巨獻(xiàn)準(zhǔn)確度超人類醫(yī)生

使用F1score來評(píng)估不同組(行)的診斷性能(Root是診斷分類的第一級(jí))

表中第二列是AI的診斷結(jié)果,后面的1組和2組都是初級(jí)醫(yī)師診斷結(jié)果,剩下的3組結(jié)果分別由三個(gè)高級(jí)醫(yī)師給出。

可以看出,機(jī)器學(xué)習(xí)模型比初級(jí)醫(yī)師組表現(xiàn)更好,但比三個(gè)經(jīng)驗(yàn)豐富的醫(yī)師組略差。

AI診斷系統(tǒng)方法介紹

數(shù)據(jù)收集

我們的數(shù)據(jù)收集自廣州婦女兒童醫(yī)學(xué)中心,來自該機(jī)構(gòu)的567498名兒科患者中獲得了1362559次門診的電子病歷。時(shí)間范圍從2016年1月至2017年7月?;颊吣挲g中位數(shù)為2.35歲,40.11%為女性。我們使用廣東省增城婦女兒童醫(yī)院的一組獨(dú)立兒科患者的11926例就診記錄,將我們的AI系統(tǒng)和人類醫(yī)生的表現(xiàn)進(jìn)行對(duì)比。

NLP模型構(gòu)建

我們建立了原始信息提取模型,從電子病歷的原始數(shù)據(jù)中提取出關(guān)鍵概念和相關(guān)類別,并將其轉(zhuǎn)換為查詢-答案組合的新格式的臨床數(shù)據(jù)。這些數(shù)據(jù)將相關(guān)癥狀進(jìn)行分組,通過表示模型依賴的確切特征來進(jìn)行診斷,從而提高了可解釋性。三名醫(yī)生策劃并驗(yàn)證了這些模式,其中包括患者主訴、現(xiàn)有病史,體檢和實(shí)驗(yàn)室報(bào)告。

中國AI臨床診斷首次被Nature翻牌:71位專家巨獻(xiàn)準(zhǔn)確度超人類醫(yī)生

自然語言處理信息提取模型的設(shè)計(jì)

NLP框架有多個(gè)組成部分:詞典構(gòu)建、符號(hào)化、單詞嵌入、圖構(gòu)建,以及使用LSTM架構(gòu)的句子分類。

詞典構(gòu)建

我們通過閱讀訓(xùn)練數(shù)據(jù)中的句子,并選擇臨床相關(guān)單詞以用于查詢-答案模型構(gòu)建來生成詞典。詞典的關(guān)鍵詞由我們的醫(yī)生策劃,并使用中文醫(yī)學(xué)詞典生成。接下來,根據(jù)醫(yī)生的臨床知識(shí)和經(jīng)驗(yàn),以及專家共識(shí)修訂詞典中的錯(cuò)誤。迭代運(yùn)行程序,直到找不到現(xiàn)有疾病和體檢的新的概念為止。然后使用這些句子來訓(xùn)練單詞嵌入模型。

架構(gòu)設(shè)計(jì)

架構(gòu)由醫(yī)生策劃的問題列表組成,用于提取癥狀信息以進(jìn)行診斷。比如問題有“患者是否發(fā)燒?”和“患者是否咳嗽?”。答案包括關(guān)鍵位置和數(shù)字函數(shù)。前者對(duì)解剖的位置進(jìn)行編碼,如肺或胃腸道。因此,該值可以是分類變量,也可以是二進(jìn)制數(shù),具體取決于要素類型。

然后,我們?yōu)槊糠N類型的病例數(shù)據(jù)構(gòu)建一個(gè)模式:由當(dāng)前疾病的病史和患者主訴,體檢與實(shí)驗(yàn)室檢查構(gòu)成。然后將此架構(gòu)用于文本新格式的建模。架構(gòu)設(shè)計(jì)的基本原理是增強(qiáng)不同醫(yī)院之間的數(shù)據(jù)的互操作性,以便將來進(jìn)行進(jìn)一步研究。此外,與使用有可能被識(shí)別出的原始病例相比,以新格式提供病例也有助于保護(hù)患者的隱私。

符號(hào)化與詞嵌入

由于缺乏公開的標(biāo)記臨床中文數(shù)據(jù)資源,我們?yōu)榉衷~建立了標(biāo)準(zhǔn)數(shù)據(jù)集。我們使用pythonTensorflow包中的word2vec來嵌入具有100個(gè)特征的4,363個(gè)令牌,以表示高維空間中單詞的語義和相似性。

LSTM模型訓(xùn)練集和測(cè)試集的構(gòu)建

我們創(chuàng)建了一個(gè)用于訓(xùn)練問答提取模型的小數(shù)據(jù)集,并在訓(xùn)練和驗(yàn)證隊(duì)列中對(duì)問答信息進(jìn)行了手動(dòng)注釋。對(duì)于答案為是/否的問題,我們使用0或1來表示。

對(duì)自由文本協(xié)調(diào)過程使用之前描述的基于注意力的LSTM建模。我們使用Tensorflow實(shí)現(xiàn)并訓(xùn)練模型。我們將NLP模型應(yīng)用于所有電子病歷中。我們沒有調(diào)整超參數(shù),而是使用LSTM模型的默認(rèn)或常用的超參數(shù)設(shè)置。

分層多標(biāo)簽診斷

診斷的層級(jí)結(jié)構(gòu)由專家醫(yī)生研究確定,采用基于解剖學(xué)的分類系統(tǒng)進(jìn)行,因?yàn)檫@是在人類醫(yī)師評(píng)估患者時(shí)制定差異化診斷的常見做法。首先,將診斷范圍分至一般器官系統(tǒng)(比如呼吸系統(tǒng)、神經(jīng)精神病學(xué)或胃腸系統(tǒng))。在每個(gè)器官系統(tǒng)內(nèi),再進(jìn)一步分為子系統(tǒng)(如上呼吸道和下呼吸道),并將“全身”專門標(biāo)記為一個(gè)系統(tǒng),適用于全身性多器官疾病的情況。

模型訓(xùn)練和驗(yàn)證

來自問答模型的數(shù)據(jù)由混合分類變量和是/否形式的答案組成。因此,我們首先通過訪問矩陣將分類和答案轉(zhuǎn)換為統(tǒng)一的二進(jìn)制特征。然后將數(shù)據(jù)隨機(jī)分成訓(xùn)練組(包括總訪問數(shù)據(jù)記錄的70%)和測(cè)試組(剩余的30%)。然后通過構(gòu)建問答矩陣,在訓(xùn)練和測(cè)試隊(duì)列中對(duì)每個(gè)訪問記錄進(jìn)行注釋。對(duì)于每個(gè)中間節(jié)點(diǎn),我們基于直接子項(xiàng)訓(xùn)練了多類線性邏輯回歸分類器。子項(xiàng)的所有子類都折疊到子項(xiàng)的級(jí)別。使用Sklearn類邏輯回歸來訓(xùn)練多類別分類器,使用默認(rèn)的l1正則化懲罰(Lasso),模擬醫(yī)生基于有限數(shù)量的癥狀進(jìn)行的診斷。

對(duì)疾病的層級(jí)聚類

為了評(píng)估聚類結(jié)果的穩(wěn)健性,我們首先將數(shù)據(jù)隨機(jī)分成兩半,一半用于訓(xùn)練,另一半用于測(cè)試,并獨(dú)立地重新生成訓(xùn)練和測(cè)試數(shù)據(jù)的兩個(gè)聚類圖。我們通過在相應(yīng)高度獨(dú)立地切割相關(guān)的樹形圖,將訓(xùn)練和測(cè)試聚類圖中的葉子分配給10個(gè)類別。使用調(diào)整的Rand指數(shù)(ARI)24評(píng)估訓(xùn)練和測(cè)試數(shù)據(jù)之間的類別分配一致性。結(jié)果表明我們的聚類圖是穩(wěn)健的。

中國AI臨床診斷首次被Nature翻牌:71位專家巨獻(xiàn)準(zhǔn)確度超人類醫(yī)生

無人監(jiān)督聚類NLP從兒科疾病中提取文本特征(灰色框內(nèi)是聚類塊)

在一些病例中,系統(tǒng)使用相關(guān)的ICD-10代碼進(jìn)行聚類診斷,說明具備檢測(cè)與人類定義的分類系統(tǒng)一致的臨床特征的趨勢(shì)。但是,另一些時(shí)候,系統(tǒng)會(huì)將相關(guān)類型的診斷分為一類,但不包括該類別中的其他非常類似的診斷。比如將“哮喘”和“咳嗽變異性哮喘”分到同一組中,但該類中不包括“急性哮喘惡化”,該病與“急性鼻竇炎”組合在一起。在許多情況下,即使沒有任何定向標(biāo)記或分類系統(tǒng),系統(tǒng)也成功建立了相關(guān)診斷的廣泛分組,這表明我們開發(fā)的臨床特征成功學(xué)習(xí)了建模和診斷的條件之間的關(guān)鍵的相似性和差異。

AI系統(tǒng)與人類醫(yī)生的表現(xiàn)對(duì)比

我們選擇了20名兒科醫(yī)生,根據(jù)多年的臨床實(shí)踐經(jīng)驗(yàn)對(duì)11926條病歷記錄進(jìn)行手動(dòng)標(biāo)記。這五個(gè)小組的醫(yī)生涵蓋住院醫(yī)師到主任醫(yī)師,臨床實(shí)踐從3年到25年不等。每組中的醫(yī)生從獨(dú)立驗(yàn)證數(shù)據(jù)集中讀取2981個(gè)臨床記錄的隨機(jī)子集并分配診斷。每條患者記錄被隨機(jī)分配并由四名醫(yī)師(每組一名)評(píng)分。我們使用F1評(píng)分評(píng)估了每個(gè)醫(yī)師組在前15個(gè)診斷類別中的診斷表現(xiàn)。

參考鏈接:

https://www./articles/s41591-018-0335-9#Sec17

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多