美國執業(yè)醫師資格考試以難度大著(zhù)稱(chēng),而美國研究人員發(fā)現,聊天機器人ChatGPT無(wú)需經(jīng)過(guò)專(zhuān)門(mén)訓練或加強學(xué)習就能通過(guò)或接近通過(guò)這一考試。對此,有人對人工智能在臨床醫學(xué)的應用充滿(mǎn)期待,有人則開(kāi)始反思美國醫學(xué)教育及相關(guān)考試的不足。
參與這項研究的人主要來(lái)自美國醫療保健初創(chuàng )企業(yè)安西布爾健康公司(AnsibleHealth)。他們在美國《科學(xué)公共圖書(shū)館·數字健康》雜志9日刊載的論文中說(shuō),他們從美國執業(yè)醫師資格考試官網(wǎng)2022年6月發(fā)布的376個(gè)考題中篩除基于圖像的問(wèn)題,讓ChatGPT回答剩余350道題。這些題類(lèi)型多樣,既有要求考生依據已有信息給患者下診斷這樣的開(kāi)放式問(wèn)題,也有諸如判斷病因之類(lèi)的選擇題。兩名評審人員負責閱卷打分。
結果顯示,在三個(gè)考試部分,去除模糊不清的回答后,ChatGPT得分率在52.4%至75%之間,而得分率60%左右即可視為通過(guò)考試。值得注意的是,ChatGPT有88.9%的主觀(guān)回答包括“至少一個(gè)重要的見(jiàn)解”,即見(jiàn)解較新穎、臨床上有效果且并非人人能看出來(lái)。相比之下,專(zhuān)門(mén)針對生物醫學(xué)領(lǐng)域文獻訓練出來(lái)的一款大型語(yǔ)言模型PubMedGPT在類(lèi)似測試中得分率剛過(guò)50%。
研究人員說(shuō),“在這個(gè)出了名難考的專(zhuān)業(yè)考試中達到及格分數,且在沒(méi)有任何人為強化(訓練)的前提下做到這一點(diǎn)”,這是人工智能在臨床醫學(xué)應用方面“值得注意的一件大事”,顯示“大型語(yǔ)言模型可能有輔助醫學(xué)教育、甚至臨床決策的潛力”。
實(shí)際上,在這篇論文初稿寫(xiě)作過(guò)程中,ChatGPT就做出了“較大貢獻”,與研究人員關(guān)系如同事般,而安西布爾健康公司的臨床醫生們也已在使用ChatGPT改寫(xiě)一些術(shù)語(yǔ)繁多的報告,以便患者理解。
新西蘭惠靈頓維多利亞大學(xué)軟件工程講師西蒙·麥卡勒姆對人工智能在醫學(xué)領(lǐng)域的應用同樣樂(lè )觀(guān)。他告訴法新社記者,谷歌公司一款名為Med-PaLM的人工智能醫療助手“能夠向患者提供和專(zhuān)業(yè)全科醫生一樣好的建議”。隨著(zhù)技術(shù)不斷發(fā)展,“我們可能很快會(huì )從‘谷歌醫生’或‘必應(微軟旗下搜索引擎的名稱(chēng))護士’那里得到醫學(xué)方面建議”。
版權所有?同江市金山公墓有限責任公司黑ICP備18002205號-1