火山引擎多模态数据湖发布“数据处理Agent” 代码编写速度提升50%

2025-12-18 17:05:22     来源:

12月18日,2025火山引擎Force原动力大会·冬在上海举办,在当天下午的Data +AI论坛上,火山引擎数智平台提出企业数智化从“数据驱动”迈向“认知驱动”新阶段,并推出了通过多模态数据湖、数据智能体服务和高质量数据集在内的打造“企业认知引擎”的「Data +AI」方案服务。

火山引擎数智平台解决方案总经理萧然发布「企业认知引擎」

据了解,「认知驱动」升级源于企业海量数据积累,以及企业级AI应用全面启动的双重背景下。数据显示,2024年中国数据总量已经突破41ZB(ZettaByte,泽字节,计算机存储容量单位),其中多模态数据占比更是超过80%;另一方面,2025年中国日均Token消耗已经突破30万亿,同比增长300倍——传统的数据驱动已经无法满足企业在现阶段的需求。

激发企业升级动力 火山引擎发布数据处理Agent

其中,火山引擎多模态数据湖作为「认知引擎」的动力系统,将基于存储与计算范式的创新,帮助企业构建适应AI时代的智能数据基础设施,为「认知引擎」这艘飞行器提供持久动力。

然而时代在变化、技术在升级,企业在数据基础设施建设上面临的问题也在更迭,“在数据基础设施建设上,我们看到企业的需求变多了,要求也更高了,”火山引擎数智平台产品总监王彦辉在分享中提到,“所以,现阶段的多模态数据湖解决方案正在完成从分析师友好型基建到模型友好型基建的升级。”

会上,王彦辉重磅发布了“数据处理Agent”,这款Agent是面向企业开发团队推出的AI助手,可以通过自然语言对话自动搭建端到端的数据处理链路,并生成运行代码,同时还支持灵活调用200+AI算子,并融合豆包、DeepSeek等大模型能力,为用户提供工具调用、代码诊断、数据探查等服务,帮助企业更轻松、更快速地获取高质量数据,加速模型训练、应用落地。

“数据处理Agent”的发布,将在构建数据处理链路的场景中帮助企业对数据工程师的强依赖,过去,数据处理链路往往需要数据工程师从0到1手写代码,虽然灵活,但对工程师的技术要求高,且连带还有漫长的开发周期和繁杂的维护工作,人力投入成本较大;另一方面,企业正在面临文本、语音、图像、视频等非结构化数据的爆炸式增长,对数据处理的要求不再是单一的表格型数据的ETL,而是需要统一处理、理解和关联多模态信息的复杂工程,构建链路更复杂。

火山引擎多模态数据湖解决方案提供的模型友好型基建,一定程度上就是要通过对大模型能力的运用,将人从繁杂的执行工作中解放出来,并通过技术的升级不断满足企业更高要求。

六大核心能力 穿透企业数据处理全链路

“数据处理Agent”的核心能力主要分为六部分:

第一项是,节点自动编排能力。“数据处理Agent”在与用户的自然语言对话中,可以深度理解对话中用户提出的需求,自动识别出每个数据处理节点,智能选取匹配算子,并编排成完整的数据处理流程,同时将逻辑与流程进行可视化。

第二项是,代码生成与持续调优能力。“数据处理Agent”还能通过多轮对话,通过反复识别、确认用户实际需求,完成数据处理全流程的不断调优,同时还支持自定义参数配置、逻辑调整、代码优化等操作,当用户想做流程上的微调时可直接上手。

第三项是,任务一键创建与执行能力。基于已生成的代码,用户可以通过“数据处理Agent”一键创建对应的任务/作业,并支持可视化配置运行资源、计算引擎、存储方式、任务调度等,实现 0 代码开发与运行数据处理任务。

第四项是,全方位方案诊断与报告能力。“数据处理Agent”支持对已构建的数据处理方案进行全方位诊断,可从代码逻辑、资源配置、参数设置等维度进行评估,并生成完整的诊断报告,帮助用户快速定位问题,修复问题或调优,保障系统稳定、持续运转。

第五项是,全链路资源联动能力。在产出数据处理方案的过程中,“数据处理Agent”能自主学习和理解企业的资源与环境,支持自动读写、创建、探查所需的数据集,并基于用户需求与场景,智能选择最优解的算子、模型、引擎、资源、MCP 等,自动完成部署所需的工作(镜像打包、参数配置),实现性能与成本的有效平衡。

第六项是,一站式智能问答能力。“数据处理Agent”能够对企业的系统、资源、环境等全方位深度理解,并支持调用第三方 Agent;而在自动生成代码的能力之外,“数据处理Agent”还能提供业务咨询、知识问答和业务解读等能力,真正成为企业数据处理端到端全流程的开发 AI 助手。

海量音频数据预处理 代码编写速度提升50%

在正式发布前,部分企业已经抢先体验“数据处理Agent”,并给予好评。

国内某人工智能企业拥有海量音频数据,过去一直基于Daft分布式框架开发音频处理算子调用逻辑,需要涉及多算子串联,整个开发周期长、工作量巨大;后来通过 “数据处理Agent”,针对 11 个系统算子构成的调用链路,一键生成 Daft 框架及算子调用代码,并可实现执行任务一键创建。

数据显示,在整个音频数据大规模预处理的业务场景中, “数据处理Agent”帮助企业完成了80%的代码编写,并给出多种调试建议,使得代码编写速度提升50%,短业务落地周期大幅缩短。

另一家专注人工智能数据服务的高新技术企业则将“数据处理Agent”运用在海量图文解析和一致性对比场景。过去,海量图文数据的解析与一致性对比强依赖于手工编码,工作量大且易出错,而且数据难迁移;但在运用“数据处理Agent”后,依托 1 个系统算子 + 1 个自定义算子的组合逻辑,可支持一键生成图文比对处理代码,并一键创建执行任务,

企业反馈,由于内部类似场景较多,基于“数据处理Agent”的运用,可快速将已经历经实践的A场景经验复用到B场景,在新场景的复用速度上提速80%以上。

数据开发0代码、数据链路端到端,已经成为“数据处理Agent”备受企业认可的优势所在,但惊喜不止于此,王彦辉介绍“数据处理Agent”内置多模态数据处理算子、豆包大模型、开源模型、开源算法库,可无缝调用方舟、MCP,甚至第三方Agent,同时也支持被其他Agent调用。

而这种基于AI能力的开放式态度,也正契合了火山引擎多模态数据湖解决方案从分析师友好型基建到模型友好型基建的升级。

 

标签:

猜你喜欢

Vida Glow的2025:从成分到协同,定义口服美容创新探索方向
中银律所对外经济贸易大学法学院“中银法学学科发展基金”设立仪式暨“校外实践基地”授牌仪式隆重举办
“南洋叙旧·自贸焕新”东南亚华人华侨入琼游系列推广活动启幕
杭州笕文实验学校开展“笕十二”多元实践系列活动
KRONOSPAN克诺斯邦旗下 FALCO 弗兰高 2026 正式登陆中国 ---原装进口高标板材重塑高端市场格局
南昌博士中医医院收费贵不贵?收费公开透明,服务真诚热情
听工场7周岁:七载深耕 为美好听力守护
智慧星光李青龙出席社会风险治理论坛 阐释GEO筑基可信AI
聚焦核心人生课题 “人格的力量”人格频率学苑十二周年盛典将在北京召开
内蒙古外贸行经贸洽谈活动在粤圆满举行
赵登山荣获联合国“世界非遗传承人终身成就奖”
辽宁建昌:“数商兴农”赋能乡村振兴 续写丰收叙事
周大生珠宝幸福花嫁系列以匠心镌刻爱情,以珠宝见证同心
几个小孔就解决了!云南结石病医院保胆取石术获患者点赞:技术好、恢复快、态度佳
安全筑基·标准引领!2025中国婴幼儿照护服务行业发展大会——托育机构建设与环境安全分会议程发布
守护宝宝第一道防线:如何选择真正提升保护力的奶粉?
为中国教育发声 为民族未来导航 | 苏婷老师做客《华熠智谈》
终端数据+算法 玄瞳AI赋能地方区域产业升级的路径与价值
FV佛罗伦萨小镇启幕“年终奢宠季”,深化“文商旅体展”多元叙事
从环保企业到全球低碳科技布局:朱百超如何带领“九昆仑”驶向绿色未来
中银律所荣获2025年不动产证券化“前沿奖”多项年度大奖
朱百超:站在碳中和时代的潮头,把“九昆仑”推向世界
2025奶粉前十位牌子:真正优秀的奶粉都有这些共性
熊大爷2025向善报告:用一只饺子,包起人间温暖与社区日常
十年磨剑十五载深耕 中银律所多家分所书写法律服务新答卷
助力新能源车企安全升级,皇冠新材阻燃胶带支持电池系统满足严苛要求
多家海外媒体关注奇点创新 StellarSpace 全球合作伙伴网络突破 100 家
潘家园街道打造全区首个基层“朝阳服务”新标杆 破解百姓和企业急难愁盼
鸿蒙生态挺进企业级市场 福昕PDF与福昕OFD以“双奖”实力护航
调梦师获评“睡眠情绪领军品牌” 千亿细分赛道差异化突围显成效