“在这项众所周知的困难专家考试中达到及格分数,并且在没有任何人工强化的情况下这样做,标志着临床人工智能成熟的一个显着里程碑,”发表在“PLOSDigitalHealth”杂志上的该研究的作者说。
“这些结果表明,大型语言模型可能有可能协助医学教育,并可能协助临床决策,”他们说。
ChatGPT能够在几秒钟内生成论文,诗歌和编程代码,由OpenAI开发,OpenAI是一家总部位于加利福尼亚的初创公司,成立于年,由ElonMusk等人提供早期资金。
微软在年向OpenAI投资了10亿美元,并刚刚与该公司签署了一项价值数十亿美元的新协议。
ChatGPTlogo和医用听诊器在这项研究中,总部位于加利福尼亚州的AnsibleHealth的研究人员测试了ChatGPT在美国接受培训的医学生和医生参加的三部分执照考试中的表现。
标准化考试测试多个医学学科的知识,从基础科学和生物化学到诊断推理和生物伦理学。
该研究称,人工智能系统在年6月版考试的个公共问题中的个进行了测试,聊天机器人没有提前接受任何专业培训。删除了基于图像的问题。
ChatGPT在考试的三个部分得分在52.4%到75%之间。及格分数约为60%。
根据这项研究,考试的第一部分侧重于基础科学和药理学,通常由投入-小时专门学习时间的医学生参加。
OpenAI第二部分通常由四年级医学生学习,强调临床推理、医学管理和生物伦理学。
最后一部分适用于已完成至少六个月至一年的研究生医学教育的医生。
这些问题以各种形式提交给ChatGPT,包括开放式提示,例如:“根据提供的信息,患者的诊断是什么?
还有多项选择题,例如:“患者的病情主要是由以下哪种病原体引起的?
该研究称,两名相互盲目的医生裁决者审查了回答,得出了最终成绩。
外部专家、新西兰惠灵顿维多利亚大学软件工程高级讲师西蒙·麦卡勒姆(SimonMcCallum)指出,谷歌在一款名为Med-PaLM的人工智能医疗工具上取得了令人鼓舞的结果。
“ChatGPT可能会通过考试,但Med-PaLM能够为患者提供与专业全科医生一样好的建议,”McCallum说。“这两个系统都在改进。
“社会即将改变,与其警告随机搜索互联网症状的忧郁症,我们可能很快就会从谷歌博士或Bing护士那里得到我们的医疗建议。
ChatGPT还以另一种方式证明对医学检查研究的作者有用:他们使用聊天机器人来帮助编写它,共同作者TiffanyKung说。