ChatGPT的出现重构了人们对于AI的想象。一时间内,做模型的,做应用的,一拥而出。适才三个季度,市面上垂直于医疗的大语言模型,数量已经达到两位数。
不过,医疗异于其他产业。回顾过往医疗科技的发展足迹,一项新兴技术能否规模化地应用于医疗机构,不在于市场参与者的数量,而在于随技术而生的产品,能否真正与医生的工作融为一体。
问题便在于此。
对于大模型而言,什么是医院的真实需求?怎样才能满足医院的真实需求?
大模型之于医疗的意义是什么?
具备商业化潜力的AI通常具备两个特征:一是高频,二是提效。
所谓高频,是指医疗大模型在各个场景中被频繁应用。在卫宁健康总裁王涛看来:在医疗领域,基于生成式AI而衍生出的医疗应用或将成为医务工作者离不开的贴身助手,它将作为一个超级大脑而存在,不仅能高效地调度和整理数据资源,甚至能引发自主思考,提升医务工作者的工作效率、医疗质量,并做到有效的辅助决策。
其次是提效,即为算法的购置方带来实打实的收益。一个理想的医疗大模型应该能够实时质控医院各个医疗流程;以最小成本满足政策对医院提出的IT需求,进而为医院的发展运营带来新的可能性。
医院之中符合此类特征的场景非常多。举两个例子,医患沟通、病历书写都是AI应用的经典需求。
先谈医患沟通。不同于其他第三产业,医生与患者之间的“交点”非常频繁,贯穿整个诊疗流程。但由于医患信息的不对称性,大量无效交流穿插其中。
对于本已供不应求的服务提供方医护人员而言,大量碎片化、重复的交流贯穿工作之中,不仅源源不断地产生压力,亦挤压了诊疗与科研时间。对于患者而言,部分医护人员因压力所迫,无法进行详尽的交流,在不同程度上会影响就医体验,甚至可能成为引燃医患矛盾的导火线。
再谈病历书写。在前不久召开的一场医疗IT大会中,多位院长、卫健委领导都积极谈论了大模型及其相关技术的未来:能不能使用大模型来辅助质控流程?能不能使用生成式AI来自动书写病历?他们认为,在医生的日常工作中,病历的理解与书写是一个极为重复耗时的过程,只有将医生从这些繁琐的工作中抽离,才能帮助其实现更大的价值。
因此,大模型之于医院的意义,在于找到医院场景中的高频环节,辅助医护人员高效完成高重复度的工作,进而发挥医护人员的比较优势,助其专注于诊疗与科研,进而推动医院整体能力的良性发展。
但也有人会问:如此陈旧的需求,自然语言处理(NLP)不是早已能够解决吗?可以,但又并非完全可以。
大模型强在哪里?
90年代初,技术人员便开始尝试用IT手段辅助医生诊疗,降低医生的工作强度。但那时的成果“专家系统”存在缺陷,仅以简单的数据映射或简单算法难以应对并不复杂的医学问题。
毕竟,医学诊断讲究“望闻问切”,需要医者通过多感官多渠道的信息获取,检验检查等多种辅助手段,加之医学知识和逻辑的综合判断,才能进行有效诊断。只是通过患者简单的主诉,而不能将患者年龄、身体状况、既往病史等进行综合判断,这样的“诊断”不过是碰碰运气。
因此,“专家系统”并未真正从理论走到实践。直到二十一世纪的第二个十年,传统基于规则或统计方法的NLP的出现,才重新唤起了人们对于智能技术的憧憬。近几年来,基于NLP的病案质控、CDSS等系统已普遍应用于管理、临床。
不过,这类NLP也有其局限性。
“尽管早先基于规则或统计方法的NLP技术强化了人工智能的分析能力,但它没有脱离通过‘输入信息-关联数据库-搜索结论’的逻辑。”卫宁健康CTO赵大平在采访中表示,“这种推理的方式只考虑了‘上文’,忽视了‘下文’。相比之下,医生的推导过程不仅会囊括各类报告给到的数据,还会根据过往经验推断数据之外的可能。”
严格意义上说,大模型同样是NLP 的一种形式,但相比较基于规则或统计方法的NLP,知识数据驱动的大模型更具备了自我进化的能力。
具体而言,进化能力的本质来自训练神经网络时采用的随机梯度下降算法,这种算法让程序沿着一定方向一代又一代地随机摸索,一定程度上等效于物种的基因突变。
强大的生存压力下,错误的摸索被淘汰,而正确摸索被积累,久而久之,某些高阶的功能就这么涌现出来了。这些涌现出来的高阶能力不仅能够自动提取重要信息,理解和生成信息;也可融合模型内的知识补全不完备的信息,形成完整的推理。
这样的能力在医疗场景之中尤其珍贵。譬如在辅助医生解读医学影像这一场景中,基于大模型的人工智能不单单是基于给定的影像信息进行辅助诊断,还能通过过往学习结合知识处理影像之中的瑕疵,以更快的速度给出更为精准的辅助诊断结果。
此外,LLM的沟通能力在ChatGPT中的应用也为世界所见证。迁移至垂直领域后,经过预训练和微调的模型能够有效用于医患交流,优化智能导诊、智能问诊、智能随访等应用。而对于更为复杂的病历书写,它能帮助AI脱离模板,像一个真正的资深医生一样理解、生成电子病历。
医疗大模型落地,最难的挑战在哪里?
颠覆式的潜力之下,大量互联网企业、头部医疗IT公司涌入大模型赛道。但要使得大模型触及临床,模型训练已经何其艰难,模型落地还要再添挑战。
在理解大模型落地之难前,我们不妨先看看英国文学家艾略特提出的DIKW知识模型。简单来说,该模型将广义上的知识分为 Data(数据) - Information(信息) - Knowledge(知识) - Wisdom(智慧) 四层金字塔结构。
DIKW知识模型与如今的人工智能
传统的逻辑下,我们将数据不断提纯,升维成知识甚至智慧,进而作为应用的基础。而在人工智能时代,我们着重对第二层的信息流进行处理,一方面去粗取精,升维取得知识,构建智能化的基础;另一方面标准化处理,降维得到数据,形成数字化的基础。拥有知识、数据后,再辅以算法与算力支持,一个大模型就完成了。
王涛在采访中对两种模式进行了对比,他认为:从完全的升维到大模型时代的一升一降,其实质是思考逻辑的转变。将这种变化其置于医疗系统之中,便是要将“技术支持应用”的系统架构改写为“技术应用并行”。
因此,大模型的落地,亟须解决的是医疗信息系统对于大模型的兼容问题。
目前能够提供“技术应用并行”式医院信息管理系统的医疗IT企业不多,仅头部数家企业在深度学习大热之时便看到系统架构变更的必要性,打造了能够保障AI完美运行的医疗管理系统。
以卫宁健康为例,其新一代医疗管理信息系统WiNEX在设计之初便已经考虑到了对“智能化”(Intelligence)的架构支撑,其内涵的EA+AI智能架构保证了在每一层中都能支持AI的运行。
卫宁健康EA+AI智能架构
WiNEX的创新架构非常适合大数据在院内场景下的迭代。为保障大模型在应用过程中的流畅性与在学习过程的持续性,只考虑在信息化流程中数据记录远远不够,还需要考虑数据计算的架构,需要业务流程与技术流程随时互动。因此,相较于传统EA企业架构,EA+AI智能架构的根本变化是对业务和技术进行了重构,将基于GPU计算的架构和CPU架构并行,使其共同支撑业务,筑起了大模型系统环境的基底。
有了智能化的架构作为支撑,卫宁健康在开发大语言模型时便得心应手许多。实际上,卫宁健康为其自主打造的医疗大模型建立了一个智能服务层。这一层位于业务应用与数据处理之间,使得大模型能够实时与业务、数据完成交互,实现任一流程数据的升维与降维,反哺大模型的迭代与升级。
卫宁健康医疗大模型WiNGPT技术框架
当然,系统问题只是诸多落地问题的一个重要分支,要让大模型稳稳运行于医院,开发者们还需要注意一些细节。譬如要尽可能实现“无感”,让医生无需频繁切换便能快速应用大模型的功能。
这一看似常规的要求,却是互联网公司们的一大考验。由于没有HIS、PACS等业务系统,大模型往往以外挂的形式存在。
虽然外挂的形式不会对模型的性能产生过多影响,但对于医生这一使用者而言,每次调用系统便需切入大模型界面进行启动,大模型的体验及工作的流畅程度都将大打折扣。
相比之下,医疗IT公司们显然更具优势。拥有WiNEX作为支撑,卫宁健康能让各科室的医生在完全不改变业务系统操作流程的前提下享受大模型内涵的诸多功能,已在落地环节拔得头筹。
大模型便是越大越好?
在讨论通用模型时,模型的参数量很大程度决定了它的知识学习能力与复杂任务处理能力。因此,国内互联网巨头推出通用模型参数量都在千亿级,GPT系列的参数则达到了万亿级。
但在医疗这类垂直领域,模型的量并非越大越好。有的时候,过大的模型,反而会成为限制其商业化的负担。
由于临床相关的数据不能脱离院区,大模型的落地只能通过封装之后入院运行。但现阶段大部分医院现有资源环境基本是以面向通用计算的CPU,很少有医院有面向图形处理和并行计算的GPU资源,缺乏大模型的部署环境,因而需要在购置应用的同时配备GPU运营大模型应用,并保证足够的存储和高速的网络连接。如果模型过大,医院的配置成本也将因此直线上升。
为了解决上述问题,卫宁健康一直尝试保证应用质量的前提下控制参数规模。赵大平表示:“卫宁健康现有的大模型WiNGPT已经可以实现大部分医疗场景需求,它的参数量为130亿。对于这样一个大模型,单个科室GPU及硬件配置成本控制在10万元之内。而在全院应用大模型,也可以采用更多企业级的GPU并行的方案,配置费用也不过百万元。”
那么,什么量级的参数才能完整覆盖医院的整体需求呢?
根据WiNGPT现有的表现,王涛认为:中文医疗大模型的参数可控制于150亿左右,包含语言与多模态影像的大模型参数可控制于500亿内。WiNGPT的目标参数量是130亿,而在即将推出的第三代大模型——医学影像多模态模型中,300亿参数已经可以满足垂直领域的众多需求。
医疗大模型需要一个“杀手级应用”?
到目前为止,许多企业已经在大模型的基础上推出了多个应用。同样以卫宁健康为例,其文书生成可以自动提取重要信息,理解和生成电子病历、出院小结等文档,形成病历章节,减轻医生的工作量;其医学影像解读能够辅助医生解读医学影像,例如X射线、CT、MRI等,生成影像报告、体检报告,提高诊断的准确性和效率……
粗略一看,大部分企业围绕大模型做的仍是传统场景下的应用,没有找到一个杀手级的应用场景,推动大模型的落地。
但这样的形势或许打开一条新的路径。在王涛看来,医疗大模型的定位本就应是“Copilot”(副驾驶),作为医生的智能化助手与医生一起成长,一起解决诊疗科研中的难题,这也是卫宁健康打造大模型的愿景所在。
在未来的理想时代,所谓的“杀手级应用”,便是每一个医生都拥有一个符合自己风格、与自己精准匹配的大模型。