醫(yī)聯(lián)MedGPT丨“診斷”直播測(cè)評(píng)!治療方案與真人醫(yī)生96%一致
據(jù)消息,醫(yī)聯(lián)研發(fā)的國(guó)內(nèi)首個(gè)醫(yī)療大模型:MedGPT,已經(jīng)在“接診”患者了。
不可否認(rèn)的是,MedGPT還有些問(wèn)題需要調(diào)整,幾位專家指出它會(huì)出現(xiàn)偶爾過(guò)度給出治療建議、重復(fù)推薦檢查項(xiàng)目、某些概念表述不準(zhǔn)確,以及無(wú)法實(shí)現(xiàn)查體等局限——要想MedGPT更加可用,這些意見(jiàn)一定程度比正面評(píng)價(jià)還要重要。
【資料圖】
但總的來(lái)說(shuō),首個(gè)醫(yī)療大模型的公開(kāi)首秀的結(jié)果還算不錯(cuò)。
總結(jié)下來(lái),首先是大模型的基本能力都有,語(yǔ)義理解、多輪對(duì)話、多模態(tài)識(shí)別等,還能像OpenAI那樣通過(guò)插件商店鏈接到各種行業(yè)應(yīng)用。
還有通用大模型被廣為詬病的對(duì)齊和準(zhǔn)確性問(wèn)題,MedGPT整個(gè)流程結(jié)果也不輸真人醫(yī)生。
再?gòu)男袠I(yè)維度來(lái)看,確實(shí)能真正從醫(yī)學(xué)角度為醫(yī)生提供有效幫助,提升患者疾病管理效率。
此次真實(shí)測(cè)試過(guò)程中可以看到,它能基于有效問(wèn)診以及醫(yī)學(xué)檢查數(shù)據(jù),MedGPT得以進(jìn)行準(zhǔn)確的疾病診斷,并為患者設(shè)計(jì)疾病治療方案。
甚至在診后,MedGPT還會(huì)在患者收到藥品后進(jìn)行用藥指導(dǎo)與管理、智能隨訪復(fù)診、康復(fù)指導(dǎo)等智能化疾病管理工作。
目前它基本覆蓋ICD10的60%疾病病種,這意味著常見(jiàn)病癥都能Hold住還能7*24小時(shí)不間斷干活,一旦規(guī)?;涞剌o助醫(yī)生診療,能大大提升醫(yī)療效率,對(duì)于分級(jí)診療,醫(yī)療資源普惠,都能夠發(fā)揮一定作用。
首個(gè)醫(yī)療大模型如何煉成?
醫(yī)療向來(lái)是AI落地中專業(yè)性最強(qiáng)、壁壘性最高,對(duì)安全要求最高的領(lǐng)域之一。
以往用戶們會(huì)習(xí)慣性使用信息搜索來(lái)幫助自己做一些初步的疾病判斷,但信息魚(yú)龍混雜,普通用戶缺乏專業(yè)知識(shí)無(wú)法進(jìn)行有效篩選,最終導(dǎo)致往往會(huì)收效甚微。
但又因?yàn)檫@個(gè)領(lǐng)域牽涉到每個(gè)人的生命健康,市場(chǎng)需求和社會(huì)價(jià)值一直很大。
因此自ChatGPT誕生以來(lái),關(guān)于何時(shí)能在醫(yī)療領(lǐng)域“上崗”發(fā)揮作用,就備受產(chǎn)學(xué)研各界專家的關(guān)注。
誠(chéng)如“弱智吧”成為檢驗(yàn)各個(gè)通用大模型能力的Benchmark一樣,各個(gè)大模型的醫(yī)療能力也在美國(guó)執(zhí)業(yè)醫(yī)師資格考試USMLE中摩拳擦掌。
早些時(shí)候,?哈佛大學(xué)教授曾親自下場(chǎng)測(cè)試ChatGPT輔助診斷的表現(xiàn)。
結(jié)果顯示,ChatGPT在45個(gè)案例中39個(gè)診斷正確,并為30個(gè)案例提供適當(dāng)?shù)姆衷\建議。這樣的表現(xiàn)已經(jīng)超過(guò)現(xiàn)有機(jī)器診斷水平,接近醫(yī)生。
另一個(gè)代表,谷歌健康團(tuán)隊(duì)打造的Med-PaLM 2,它能回答各種醫(yī)學(xué)問(wèn)題,據(jù)稱是首個(gè)在美國(guó)醫(yī)療執(zhí)照考試中達(dá)到專家水平的大語(yǔ)言模型。
但能做題并不能意味著就能落地應(yīng)用。
以GPT-4為首的通用大模型,他們高度依賴文本統(tǒng)計(jì)概率生成答案。相信大家也能感知到它很擅長(zhǎng)一本正經(jīng)地胡說(shuō)八道,如果應(yīng)用在日常交流,倒也樂(lè)在其中。
但要是應(yīng)用到行業(yè)中去,往往非專業(yè)人士會(huì)難以察覺(jué),這就會(huì)引發(fā)各種風(fēng)險(xiǎn),尤其又像醫(yī)療這種民生行業(yè),對(duì)內(nèi)容生成的把控要求更高,容不得半點(diǎn)差池。
更不用說(shuō)醫(yī)療本身覆蓋知識(shí)面廣而繁雜,而且從整個(gè)就醫(yī)流程來(lái)看,診前、診中、診后都涉及各種各樣長(zhǎng)尾任務(wù),所需高質(zhì)量數(shù)據(jù)可能并不比通用模型小,且大部分?jǐn)?shù)據(jù)不是靠網(wǎng)上摘取。
這對(duì)企業(yè)來(lái)說(shuō),不單只是算法、算力和數(shù)據(jù)的考驗(yàn),而是一整套系統(tǒng)工程性難題。
既然如此,作為國(guó)內(nèi)首個(gè)醫(yī)療大模型MedGPT,又是如何做到的呢?
簡(jiǎn)單總結(jié):專業(yè)大模型,以及多種準(zhǔn)確性機(jī)制保架護(hù)航。
首先,一上來(lái)就打造醫(yī)療大模型。
此前專業(yè)大模型的思路是,先打造一個(gè)大模型,再利用專業(yè)數(shù)據(jù)做監(jiān)督微調(diào)。但MedGPT直接是以醫(yī)療數(shù)據(jù)預(yù)訓(xùn)練、微調(diào)以及超100名醫(yī)生參與RLHF機(jī)制。
標(biāo)簽: