在人机交互技术演进的关键节点,以自然语言为核心的新一代交互模式正加速到来。缔智元科技近日指出,尽管当前90%以上的大语言模型应用仍以文本交互为主,但以语音、视觉为载体的多模态交互已成为下一代人机协作的主要方向。缔智元科技推出的基于大模型驱动的实时交互数字人,正率先在机场、公共服务等领域落地,标志着人机交互正式迈入“自然语言交互(NUI)”时代。

一、交互演进:从键盘到语音,技术推动体验升级
人机交互历经多个阶段,每一阶段均由技术突破推动:
- 键盘输入 → 鼠标与图形界面(GUI) → 手指触控(App) → 自然语言交互(NUI)
二、机场实践:数字人重塑旅客服务流程
缔智元在机场落地的旅客问询数字人,替代传统触摸屏查询机,实现服务模式根本性转变:
- 传统触摸屏设备:用户平均需要点击5–8次,才能找到相应的信息。所以设备的使用率很低,且30%旅客因操作复杂而中途放弃使用;
- 数字人系统:自然语音直接交互,意图识别准确率超过95%,仅需一轮到两轮对话即可获得相应信息,交互时长缩短至原先的1/3。
三、技术挑战与应对:从文本到语音的跨越
语音交互面临的核心难题包括:
- 语音随意性高,信息冗余约为文本的2倍;
- 噪声环境下识别率下降。
缔智元通过自研降噪与多轮对话机制,将复杂场景下的语义理解准确率提升至95%。
四、未来展望:多模态交互推动全行业变革
到2027年,数字人有望在医疗、金融、教育等超过20个行业实现规模化部署。交互内容从文本扩展至语音、视频等多模态形式,信息传递效率预计提升80%以上。
人机交互正回归“人性化”本质
随着大模型与交互技术的深度融合,人类将逐步摆脱键盘、鼠标与屏幕的物理限制,回归以语音、视觉为核心的沟通方式。缔智元科技表示,作为大模型应用的先行者,公司将持续推进数字人在多元场景中的落地,推动“像与人交谈一样与AI互动”的愿景成为现实。
