谷歌正式推出“医疗ChatGPT”——MedLM,达到医学专家水平
- 作者:
- 来源:生物世界
- 发布时间:2024-01-22 10:24
谷歌正式推出“医疗ChatGPT”——MedLM,达到医学专家水平
【概要描述】Med-PaLM是一个强大的专精医学领域的大语言模型,而设计指令微调是一种有效的数据和参数校准技术,能够提高大语言模型的准确性、真实性、一致性、安全性,减少危害和偏差等因素,有助于缩小模型与临床专家的差距,使这些模型更接近现实世界的临床应用。
- 作者:
- 来源:生物世界
- 发布时间:2024-01-22 10:24
2022年底,OpenAI推出的基于大语言模型(Large language model,LLM)的聊天机器人ChatGPT展示了令人印象深刻的强大能力。
为应对异军突起的OpenAI,谷歌在今日推出了其生成式人工智能模型——Gemini,谷歌表示,这是迄今为止功能最强大、最通用的人工智能大模型,其在许多测试中击败了OpenAI最近的GPT-4。
除了与OpenAI的直接竞争外,谷歌还致力于开发其他更专业的生成式人工智能项目,其中就包括医疗人工智能大模型——MedLM。谷歌表示,该模型已经可以通过公司的Vertex AI平台向美国谷歌云客户提供,该平台使用机器学习工作流来指导用户通过训练、评估和部署生成式人工智能模型的过程。与此同时,美国以外的某些市场可以“预览”这些工具。
MedLM模型基于Med-PaLM 2,Med-PaLM 2是谷歌进军医疗人工智能大模型的第二次尝试。去年,其开发的Med-PaLM模型因通过了美国医疗执照考试(USMLE)而成为头条新闻(准确率为67%),而今年,Med-PaLM 2进一步将准确率大幅提升至86.5%,根据谷歌的说法,该分数相当于“专家”医生水平。
谷歌表示,MedLM模型有两个版本,其用途之间的差异在于,第一个MedLM模型更大,专为复杂任务设计。第二个是中等模型,能够进行微调,最适合跨任务扩展。谷歌表示,在未来几个月会将基于Gemini的模型集成到MedLM模型中,以进一步扩展其人工智能功能。
谷歌表示,此次新推出的医疗人工智能大模型——MedLM,旨在用于整个医疗保健行业的各个方面,包括医院、药物开发、面向患者的聊天机器人等。例如,美国医疗保健巨头HCA Healthcare正在将MedLM模型用于记录临床医生与患者之间的对话,并将其自动转译为医疗记录,从而提高记录的质量。AI药物发现平台BenchSci正在使用MedLM模型快速筛选大量临床数据并识别某些疾病和生物标志物之间的联系。
该论文展示了谷歌开发的一个专精医学领域的大语言模型——Med-PaLM,其能够很好的回答医学问题。
在这项研究中,提出了一个基准,称为MultiMedQA:它结合了6个涵盖专业医疗、研究和消费者查询的现有问题回答数据集以及HealthSearchQA——这是一个新的数据集,包含3173个在线搜索的医学问题。通过这一基准来评估大语言模型回答医学问题的真实性、在推理中使用专业知识、有用性、准确性、健康公平性和潜在危害。
01
表现令人鼓舞
02
升级版——Med-PaLM 2
Med-PaLM 2根据14项标准进行了测试,包括科学事实、准确性、医学共识、推理、偏见和危害,由来自不同背景和国家的临床医生和非临床医生进行评估。研究团队还发现该模型在回答医学问题方面仍存在一些差距,但并未具体说明,谷歌表示,进一步开发和改进该模型以解决这些差距,并了解大语言模型如何改善医疗保健。
03
据报道,Med-PaLM 2目前正在世界顶尖的医疗机构梅奥医学中心进行初步试验。谷歌认为,这种模式在“看病机会有限”的国家尤其有用。他们还表示,在Med-PaLM 2试验期间提交的用户数据将被加密,谷歌无法访问,并由用户自己控制。
总的来说,Med-PaLM是一个强大的专精医学领域的大语言模型,而设计指令微调是一种有效的数据和参数校准技术,能够提高大语言模型的准确性、真实性、一致性、安全性,减少危害和偏差等因素,有助于缩小模型与临床专家的差距,使这些模型更接近现实世界的临床应用。
责任编辑:亦欣
免责声明:本网发布的文章及图片是以同广大读者交流互动为宗旨,无商业活动,并在此向原作者表示感谢,版权归原作者所有。除非无法确定作者及来源,本网都会标注,且本网不负有任何法律责任,如有异议请与本网联系。