在回答“大模型看病能否相信”前,申城好網(wǎng)民專家、復(fù)旦大學(xué)附屬華山醫(yī)院普外科副教授周易明先舉了一個(gè)真實(shí)案例:一名患者胃上部潰瘍伴巨大穿孔,按照臨床診療指南應(yīng)全胃切除,通用大模型也建議全胃切除,卻緊接著給出一個(gè)讓人啼笑皆非的建議“術(shù)后使用質(zhì)子泵抑制劑(一種抑制胃酸的藥物)預(yù)防應(yīng)激性潰瘍”——胃已全部切除,何談抑制胃酸?
當(dāng)前,患者帶AI大模型就醫(yī)的話題熱度很高。周易明和AI創(chuàng)業(yè)團(tuán)隊(duì)聯(lián)合研發(fā)的醫(yī)學(xué)AI引擎“KnowS”是國內(nèi)首個(gè)面向臨床醫(yī)生的專業(yè)AI醫(yī)學(xué)知識(shí)引擎,近日已通過成果轉(zhuǎn)化成功落地,正幫助全國31個(gè)省市醫(yī)護(hù)診療。作為從業(yè)10余年并且懂大模型架構(gòu)和原理的醫(yī)生,他明確表示,公眾應(yīng)謹(jǐn)慎參考大模型建議,不可輕信,并給出了詳細(xì)理由。
(資料圖)
AI幻覺、數(shù)據(jù)更新不及時(shí)都可能誤導(dǎo)
最大的問題是不少大模型存在“AI幻覺”。大模型給出的結(jié)論看似有憑有據(jù),但其實(shí)并不合理。“醫(yī)療工作容錯(cuò)率很低,一個(gè)很小的差錯(cuò),就可能導(dǎo)致不可挽救的后果。所以,‘AI幻覺’非??膳拢胀ㄈ藷o法識(shí)別?!敝芤酌髡f。
醫(yī)生們在使用通用大模型時(shí),還發(fā)現(xiàn)通用大模型缺乏理解醫(yī)學(xué)邏輯的能力,給出的建議看似專業(yè),其實(shí)模棱兩可,并不準(zhǔn)確。例如,在一個(gè)復(fù)雜直腸癌病例中,患者直腸系膜淋巴結(jié)陰性,但右側(cè)側(cè)方淋巴結(jié)懷疑轉(zhuǎn)移,8毫米大。醫(yī)生需要判斷患者先開刀還是先做放化療。對此,通用大模型表示“需結(jié)合影像學(xué)特征,進(jìn)一步明確淋巴結(jié)性質(zhì)再做決定”。然而,根據(jù)最新專家共識(shí),淋巴結(jié)短徑大于7毫米即可臨床判斷為轉(zhuǎn)移??梢?,大模型雖然找到了正確的文獻(xiàn),而且給出的建議方向正確,卻沒有理解“如何判斷側(cè)方淋巴結(jié)是否轉(zhuǎn)移”的醫(yī)學(xué)邏輯,從而給出不夠準(zhǔn)確的答案。
周易明還指出,公眾使用的通常是通用大模型,而非醫(yī)學(xué)專業(yè)大模型,經(jīng)常存在數(shù)據(jù)更新延遲等問題,致使大模型給出的診療建議不符合最新的臨床診療指南,同樣引發(fā)錯(cuò)誤診療。
比如,結(jié)直腸癌患者術(shù)后服用阿司匹林是臨床診療指南中的建議,但不同群體、不同病情有不一樣的用藥建議,而且2025年最新版的醫(yī)生采用版臨床指南對用藥建議行了大幅度更新??墒?,當(dāng)醫(yī)生測試不同通用大模型時(shí),發(fā)現(xiàn)大部分都沒有及時(shí)更新,極易誤導(dǎo)患者和醫(yī)生——事實(shí)上,這也是華山醫(yī)院醫(yī)生和AI創(chuàng)業(yè)團(tuán)隊(duì)聯(lián)合研發(fā)“KnowS”的重要原因,通過實(shí)時(shí)更新和鎖定數(shù)據(jù)庫,確保“KnowS”收錄和提供的內(nèi)容是最新且準(zhǔn)確的醫(yī)療研究成果,更好地幫助醫(yī)護(hù)人員查找臨床治療資料。
具備醫(yī)學(xué)知識(shí),但是缺乏醫(yī)學(xué)思維
也有患者詢問,如果普通人用專業(yè)的醫(yī)用大模型,是不是就能得到準(zhǔn)確的診療建議了呢?答案同樣存疑。
周易明說,“怎么問”大模型非常重要。大模型擁有龐大的數(shù)據(jù)庫,簡單來說,就是它確實(shí)具備充分的醫(yī)療知識(shí)。但是,不少通用大模型并不能像醫(yī)生那樣思考,普通患者也不知道如何從知識(shí)庫中找出最適合自己的建議。醫(yī)生在上崗前,都會(huì)經(jīng)過嚴(yán)格的培訓(xùn),這種培訓(xùn)不僅是知識(shí)積累,更是思維模式鍛煉。所以,醫(yī)生問診也是一門學(xué)問,問得精準(zhǔn)、排除干擾信息,然后根據(jù)個(gè)體情況與醫(yī)療知識(shí)庫結(jié)合,制定合適的診療方案。
對普通患者來說,詢問大模型時(shí),往往事無巨細(xì)都會(huì)問,卻不知道哪些需要重點(diǎn)關(guān)注,哪些是干擾信息?;颊邌柕迷蕉?,大模型的回答也越多,最終導(dǎo)致信息繁雜,患者反而無所適從。
“其實(shí),不僅患者可能問錯(cuò)重點(diǎn),醫(yī)生也會(huì)問錯(cuò)方向。這也是專業(yè)醫(yī)用大模型正在努力解決的問題。”周易明說,“KnowS”也在不斷優(yōu)化,以便提高大模型的“診療思維”能力:一方面采用樹狀思維,確??紤]問題周全無遺漏;另一方面運(yùn)用鏈?zhǔn)剿季S,將診療環(huán)節(jié)拆解,力求每個(gè)環(huán)節(jié)的回答都更明確、更簡潔。
此外,通用大模型的多模態(tài)處理能力也較為有限。簡單來說,它能提供文字建議,卻無法 “讀懂” 圖片類信息。就診時(shí),患者自述、圖文檢查報(bào)告等都是重要的基礎(chǔ)信息,但大模型無法同時(shí)處理這些多元內(nèi)容,難以完整掌握患者情況,自然無法給出準(zhǔn)確的診療建議。
普通人看病可以這樣用大模型
“請患者不要輕信大模型,并非全盤否定它的價(jià)值?!敝芤酌鲝?qiáng)調(diào),“公眾完全可以借助通用大模型,填補(bǔ)自身與醫(yī)生之間的醫(yī)學(xué)知識(shí)差距,進(jìn)而提升醫(yī)患溝通的效率。簡單說,就是能‘更聽懂醫(yī)生在講什么’,避免因?qū)I(yè)術(shù)語隔閡導(dǎo)致的溝通不暢。”
他進(jìn)一步解釋,這背后正是人工智能大模型遵循的DIKW邏輯:從收集零散的原始數(shù)據(jù)(Data),到加工解讀為有意義的信息(Information),再整合歸納為可用于行動(dòng)指導(dǎo)的知識(shí)(Knowledge),最終朝著能進(jìn)行決策和創(chuàng)造的智慧(Wisdom)層層遞進(jìn)。用做飯類比的話,買菜是數(shù)據(jù)采集,洗切是加工信息,菜譜是知識(shí)儲(chǔ)備,真正能做出一桌美味的飯才是智慧。這套邏輯也是大模型處理信息、生成內(nèi)容的核心框架。當(dāng)前通用大模型的優(yōu)勢,恰好體現(xiàn)在醫(yī)療數(shù)據(jù)的收集與信息的整理上。對公眾而言,既能通過它快速儲(chǔ)備基礎(chǔ)醫(yī)學(xué)知識(shí),比如提前了解自身癥狀相關(guān)的疾病常識(shí),避免就診時(shí)“一問三不知”;也能提前理清求醫(yī)思路,讓問診更有針對性。
“進(jìn)一步說,如果病程較長,病情相對比較復(fù)雜的情況下,患者或家屬如果具備一定的AI使用經(jīng)驗(yàn)和醫(yī)學(xué)常識(shí),還可以用大模型當(dāng)作自己的‘就診小秘書’,對已有的就診資料進(jìn)行梳理、提煉和總結(jié)?!敝芤酌餮a(bǔ)充道,“這樣在向醫(yī)生陳述病情時(shí),能更加條理清晰,減少冗余,幫助醫(yī)生更快得到核心信息。當(dāng)然,這絕非對患者的硬性要求,更不是讓患者只帶著大模型的結(jié)論就診。而是在條件允許時(shí),將大模型整理的內(nèi)容與原始檢查報(bào)告、病歷一起帶給醫(yī)生——前者幫醫(yī)生‘快速抓重點(diǎn)’,后者確保信息‘真實(shí)無偏差’,最終讓醫(yī)生更高效、準(zhǔn)確地掌握病情。”