医疗多智能体系统:让智能体像医生团队一样分工协作
【编者按】
本文是“打造以工作流为核心的医疗智能体”系列的第二篇,第一篇请见《从实习生到专家助手,医疗智能体的三个成长阶段》。
张先生是肺癌患者,他的病情复杂:肿瘤位置靠近大血管,同时还有糖尿病和高血压。
医院多学科团队(MDT)在讨论他的病例。肿瘤专科医生说:从分期看,应该先化疗;放疗科医生说:位置不太好,放疗风险高;影像科医生展示片子:这里确实贴近血管;病理科医生说:活检结果是腺癌,可以做基因检测;内分泌科医生提醒:他的血糖控制不理想,化疗方案要考虑。五个医生,五个视角,最终形成综合治疗方案。
没有一个医生能独自搞定所有事。这正是协作的力量。如果我们想让AI参与这样的复杂决策,是造一个“万能AI”好,还是造一群“专科AI”让它们协作好?答案是:一群协作为好。
这就是医疗多智能体系统,让一群AI智能体像医生团队一样分工协作。

为什么“一个万能AI”行不通?
有人可能会问:把所有医学知识都塞进一个大模型,让它什么都会,不就行了吗?理论上可以,但实际上有三个难题:
难题1:什么都懂,什么都不精。医学知识体系太庞大了。一个人不可能既是顶尖肿瘤专家,又是顶级影像专家,还精通药理学。AI也一样。让一个大模型同时处理影像识别、病历分析、用药审核,就像让一个人同时做外科手术、开中药方、解读心电图,结果可能是哪样都做不好。
难题2:互相冲突怎么办?肿瘤科说要化疗,内分泌科说血糖太高不适合,谁说得对?这不是知识问题,是权衡问题。一个万能AI如何协调这种冲突?它只能用“加权平均”的方式从中调和。但医学决策往往不是“中和”,而是“取舍”。
难题3:黑箱问题。如果一个AI把所有事情都包了,出错了谁负责?你不知道是它的影像识别错了,还是病历分析错了,还是推理过程错了。但如果是一群专科AI,每个负责一块,出了问题,哪个模型出的错,一眼就能看出来。
多智能体系统的核心思想很简单:分化、分工、协作。
每个智能体像一个专科医生:影像智能体负责阅片,病历智能体负责读病史,用药智能体负责审核处方,分诊智能体负责判断挂哪个科,随访智能体负责提醒患者复查。它们之间互相沟通、互相质疑、共同决策。
模式1:圆桌会议(MDT会诊式)。就像一个疑难案件到了最高法院,全体大法官开会研讨。吵得越凶,结论越可靠。
以疑难杂症诊断场景为例:首席智能体主持会议,提出病例;各专科智能体轮流发言,给出自己的判断;智能体之间可以互相提问、质疑;经过几轮讨论,形成共识或多数意见。
这种模式的优点是像真正的MDT,能发现单一视角容易忽略的问题;缺点是速度慢、成本高。
模式2:流水线(工作流式)。就像汽车生产流水线。每个工位做一件事,高效但刻板。
以急诊分诊等标准化的流程任务为例:接诊智能体收集主诉、症状;分诊智能体判断紧急程度、推荐科室;检查智能体开出必要的检查单;病历文书智能体生成就诊记录。
这种模式的优点是速度快,效率高,每个环节专业化;缺点是灵活性差,不适合异常情况。
模式3:师徒制(教学式)。如住院医师规范化培训。老医生带新医生,手把手教。
以AI的自我进化、新模型训练为例:资深的“导师智能体”示范如何诊断一个病例;年轻的“学员智能体”尝试诊断,然后和导师的答案对比;导师给出反馈:你哪里错了,为什么错,应该怎么改进;学员从错误中学习,更新自己的模型。
这种模式的优点是智能体能持续进化,不需要人工重新训练;缺点也很明显,如果一个坏AI教另一个,会“带坏徒弟”。
智能体之间要协作,就必须能沟通。医学多智能体系统中,有三种“语言”。
语言1:结构化消息(机器语言)。这是智能体之间最常用的沟通方式。不是自然语言对话,而是一种标准化的“数据包”。
举个例子,用药智能体给处方审核智能体发的消息可能是这样的:
text
{
“患者ID”: “P12345”,
“药品”: “二甲双胍”,
“剂量”: “500mg”,
“给药途径”: “口服”,
“患者肾功能”: “eGFR 45”,
“请求”: “审核是否安全”
}
处方审核智能体收到这个“数据包”,不需要理解一整段话,直接提取关键字段,就能快速判断。就像军队里用简码发命令,而不是写一封信。
语言2:自然语言(人类语言)。有些场景需要更丰富的表达。比如一个智能体想向其他智能体解释一个复杂病例。这时,它们会用自然语言对话,比如:“我怀疑这个结节是恶性的,因为边缘不规则、有毛刺……”就像医生写病历,既有标准化的化验单,也有自由描述的“现病史”。
语言3:标准化协议(沟通规矩)。光有语言还不够,还得有“沟通规矩”:谁可以和谁说话? 有的智能体只能和上级交流,有的可以随便说话。什么情况下需要汇报? 遇到不确定的事情,必须请示。意见不一致怎么办? 投票?一票否决?还是上报人类医生?这些“规矩”就是协议。它们确保智能体之间的沟通有序、安全。
3.医疗智能体时代的人机协作
智能体再聪明,也只是辅助。人是最终决策者。根据自主程度不同,人机协作也可以分为三个层次。
层次1:派活式(你命令,它执行)。医生给智能体下一条明确的指令:“帮我查一下这个药的禁忌症”“帮我写一份出院小结的草稿”。智能体完成任务,把结果还给医生。医生说一,它不干二。这是目前最常用的模式,适合简单低风险任务。
层次2:对话式(你引导,它推理)。医生不是简单下命令,而是和智能体来回讨论。AI说:“根据目前的资料,我怀疑可能是A病”;医生说:“不对,你没注意到他之前用过XX药”;AI说:“好的,那我把A病的可能性降低,重新考虑B和C……”在这个过程中,医生像导师一样引导AI,AI像学员一样不断修正。这是当前临床决策支持的主流模式。
层次3:搭档式(它主动,你监督)。这是最高级的人机协作。智能体能预判医生的需求,主动提出建议。比如手术中,机器人智能体观察到医生要切某个部位,主动调整摄像头角度,甚至主动拉钩暴露视野。医生不需要下指令,智能体从医生的动作中“读懂”了意图。这是未来方向,目前还在探索中。
一个完整的故事
多智能体是如何协作处理一个患者的?让我们讲一个完整的故事。
患者:刘女士,65岁,因“胸痛3天”就诊。
第一幕:分诊。刘女士走进医院,在自助机上和“分诊智能体”对话。智能体问了几个问题:“痛在哪里?怎么个痛法?有没有放射到别处?”初步判断:不排除心绞痛,建议挂心内科急诊。
第二幕:检查。刘女士做了心电图和心肌酶检查。结果出来后,“影像智能体”自动分析了心电图,“检验智能体”自动比对了心肌酶正常值范围。
第三幕:决策。“心内科智能体”召集了多智能体会议:“心电图智能体”汇报:ST段无抬高;“检验智能体”汇报:心肌酶正常;“病历智能体”调取刘女士的既往病史:“她有高血压病史十年。”经过讨论,“心内科智能体”给出建议:不典型胸痛,暂排除心梗,建议门诊复查。
第四幕:执行。“文书智能体”自动生成急诊就诊记录和病历摘要。“随访智能体”计划给刘女士发了一条消息:“您的急诊检查结果无异常,建议明天心内科门诊复查。已为您预约明天上午9点。”
第五幕:医生把关。最终,所有AI的输出都汇总到人类医生面前。医生花5分钟快速审阅,没问题,签字确认。一切在20分钟内完成,而传统的流程可能需要一个医生花2小时。
AI医院不是单一医疗Agent的独角戏。为什么看病不能只靠一个AI?因为医学的本质就是多维度的协作——多科室、多专家、多视角。AI医疗需要AI和AI协作、AI和人协作。这才是未来医院的图景。
【“打造以工作流为核心的医疗智能体”系列往期回顾】
下期预告:从挂号到出院,医疗智能体都能做什么?
【作者简介】
郑西川,上海交通大学附属第六人民医院计算机中心教授级高工。上海交通大学医学院生物医学工程专业硕士研究生导师,苏州大学放射医学与公共卫生学院生物医学工程专业硕士研究生导师。中国医院协会信息专业委员会(CHIMA)委员,中国医药信息学会(CMIA)委员,上海市医院协会信息管理专业委员会委员,中国医药信息学会上海分会常委,中国生物医药技术协会医药信息分会常委,《医疗卫生装备》杂志特约审稿专家。
研究方向:①基于PACS电子病历的临床信息共享;②HL7/XML电子转诊相关技术及应用研究;③区域临床信息共享及协同医疗信息技术研究;④数字化医院的相关标准及实现技术。近年来,先后承担上海市“十一五”重大科技项目、上海市科委自然科学基金项目、上海市经济信息委信息化专项基金以及院级课题多项。发表论文40余篇。

我要评论