服务粉丝

我们一直在努力
当前位置:首页 > 情感 > 故事 >

网上问医断病,这轮AI行不行?专家:现有模型尚不完善

日期: 来源:济宁新闻网收集编辑:济宁新闻网

网上问医断病,这轮AI行不行?

【今日视点】

◎记者 张梦然

你在网上搜过“我哪哪疼是不是得了啥啥病”吗?答案可能不尽如人意。但随着ChatGPT等大型自然语言模型(LLM)风生水起,人们开始尝试用它来回答医学问题或医学知识。

不过,靠谱吗?

就其本身而言,人工智能(AI)给出的答案是准确的。但英国巴斯大学教授詹姆斯·达文波特指出了医学问题和实际行医之间的区别,他认为“行医并不只是回答医学问题,如果纯粹是回答医学问题,我们就不需要教学医院,医生也不需要在学术课程之后接受多年的培训了。”

鉴于种种疑惑,在《自然》杂志新近发表的一篇论文中,全球顶尖的人工智能专家们展示了一个基准,用于评估大型自然语言模型能多好地解决人们的医学问题。

现有的模型尚不完善

最新的这项评估,来自谷歌研究院和深度思维公司。专家们认为,人工智能模型在医学领域有许多潜力,包括知识检索和支持临床决策。但现有的模型尚不完善,例如可能会编造令人信服的医疗错误信息,或纳入偏见加剧健康不平等。因此才需要对其临床知识进行评估。

相关的评估此前并非没有。然而,过去通常依赖有限基准的自动化评估,例如个别医疗测试得分。这转化到真实世界中,可靠性和价值都有欠缺。

而且,当人们转向互联网获取医疗信息时,他们会遭遇“信息超载”,然后从10种可能的诊断中选择出最坏的一种,从而承受很多不必要的压力。

研究团队希望语言模型能提供简短的专家意见,不带偏见、表明其引用来源,并合理表达出不确定性。

5400亿参数的LLM表现如何

为评估LLM编码临床知识的能力,谷歌研究院的专家谢库菲·阿齐兹及其同事探讨了它们回答医学问题的能力。团队提出了一个基准,称为“MultiMedQA”:它结合了6个涵盖专业医疗、研究和消费者查询的现有问题回答数据集以及“HealthSearchQA”——这是一个新的数据集,包含3173个在线搜索的医学问题。

团队随后评估了PaLM(一个5400亿参数的LLM)及其变体Flan-PaLM。他们发现,在一些数据集中Flan-PaLM达到了最先进水平。在整合美国医师执照考试类问题的MedQA数据集中,Flan-PaLM超过此前最先进的LLM达17%。

不过,虽然Flan-PaLM的多选题成绩优良,进一步评估显示,它在回答消费者的医疗问题方面存在差距。

专精医学的LLM令人鼓舞

为解决这一问题,人工智能专家们使用一种称为设计指令微调的方式,进一步调试Flan-PaLM适应医学领域。同时,研究人员介绍了一个专精医学领域的LLM——Med-PaLM。

设计指令微调是让通用LLM适用新的专业领域的一种有效方法。产生的模型Med-PaLM在试行评估中表现令人鼓舞。例如,Flan-PaLM被一组医师评分与科学共识一致程度仅61.9%的长回答,Med-PaLM的回答评分为92.6%,相当于医师作出的回答(92.9%)。同样,Flan-PaLM有29.7%的回答被评为可能导致有害结果,Med-PaLM仅5.8%,相当于医师所作的回答(6.5%)。

研究团队提到,结果虽然很有前景,但有必要作进一步评估,特别是在涉及安全性、公平性和偏见方面。

换句话说,在LLM的临床应用可行之前,还有许多限制要克服。


相关阅读

  • 市北区大港街道:坚持问题导向,开展点题整治

  • 为认真贯彻落实好上级要求,近期,大港街道积极开展群众身边不正之风和腐败问题“点题整治”行动,重点整治网点房餐饮油烟较大、噪声扰民等突出问题,抓好问题整改,切实解决群众身边
  • 高密:大牟家镇锚定目标不放松 凝心聚力抓落实

  • 连日来,大牟家镇坚决落实上级各项决策部署,把握目标要求,聚焦重点任务,扭住关键环节,铆足劲头、担当实干,稳步推进各项重点工作扎实有序开展。村庄清洁行动“夏季战役”为持续改善
  • 邹平市民巡访团助力文明城市创建

  • 6月29日晚,邹平市民巡访团成员张朋在巡访团工作群里发了一张路面塌陷的照片,第二天下午,创城办工作人员李玉东回复他:经现场调查核实,你反映的问题是污水管道塌陷所致,已督促水务
  • 安徽:开展司法作风突出问题专项整治

  • 主题教育开展以来,安徽省高级人民法院发扬刀刃向内的自我革命精神,在全省法院开展司法作风突出问题专项整治,聚焦审判执行领域中履行职责不担当、执法用权不规范、司法为民不尽

热门文章

最新文章

  • 来查干湖,给你一个多姿多彩的夏天

  • 盛夏时节,走进水碧景秀的查干湖,感受凉风习习,观赏各种水鸟,流连百花丛中,泛舟荷花池畔,每到一处,都让人感叹这大自然与人类共同造就的美丽景观。炎炎夏日,偌大的水面看着就让人心
  • 农发行江西省分行召开2023年运营管理工作会议

  • 7月12日,农发行江西省分行召开2023年运营管理工作会议,深入学习贯彻党的二十大精神,全面落实年度工作会议精神,总结“十四五”以来全辖运营履职发展成效,分析当前形势,安排下一阶
  • 女子被交警查获 竟然是第三次酒驾

  • 明知喝酒不能开车,可石家庄一女子却无视危险,接二连三酒后驾驶。近日,裕华交警大队在夜查行动中查获一名酒驾女司机,面对交警执法,女司机哭泣求情,交警核查其信息时却大吃一惊:这已