NVIDIA宣布推出 NVIDIA Grove简化 Kubernetes 上的复杂 AI 推理

2025-12-10 14:17:43     来源:

NVIDIA宣布推出 NVIDIA Grove,一个在 Kubernetes 集群上运行现代机器学习推理工作负载的 Kubernetes API。Grove 现已作为模块化组件集成至 NVIDIA Dynamo,它完全开源,可在 ai-dynamo/grove GitHub 库使用。

NVIDIA Grove 如何整体性编排推理负载:Grove 能够将多节点推理部署从单个副本扩展到数据中心规模,支持数万个 GPU。Grove 可将 Kubernetes 中的整个推理服务系统(例如预填充、解码、路由或任何其他组件)描述为单个自定义资源 (Custom Resource, CR)。

根据该单一配置文件,平台可协调层级化调度、拓扑感知的放置、多级自动扩缩容以及明确的启动顺序。您可以精准控制系统的行为方式,而无需将脚本、YAML 文件或自定义控制器拼接在一起。

Grove 最初是为了解决多节点 PD 分离推理系统的编排问题而开发的,它具有足够的灵活性,可以自然地映射到任何现实世界的推理架构,从传统的单节点聚合推理到具有多个模型的代理式管道。Grove 使开发者能够以简洁、声明式且与框架无关的方式定义复杂的 AI 堆栈。

Grove 原语:高性能推理框架使用 Grove 层级化 API 来表达角色特定的逻辑和多级扩展,从而在跨多种集群环境中实现一致且优化的部署。Grove 通过在其 Workload API 中使用三种层次化的自定义资源编排多组件 AI 工作负载,来实现这一点。

最终结果是多组件 AI 系统的协调部署,其中预填充服务、解码工作节点和路由组件按正确顺序启动,紧密放置在网络拓扑上以提高性能,并作为一个整体共同自愈。这防止了资源碎片化,避免了部分部署,并能够大规模稳定高效地运行复杂的模型服务管道。

如何使用 Dynamo 快速上手 Grove:原文将分享如何使用 Dynamo 和 Grove 通过 KV 路由部署组件部署 PD 分离服务架构。该设置使用 Qwen3 0.6B 模型,并演示了 Grove 通过独立的预填充和解码工作节点管理分布式推理工作负载的能力。

 

标签:

猜你喜欢

中国餐饮创新大会揭榜:鱼你在一起入选“中餐出海标杆TOP10”
双双超2000亿美元估值 Tether和维塔金是怎么炼成的
顺丰发布亚太大件产品矩阵,为中资及东南亚本土企业注入强劲动力
ASICS亚瑟士携手河村勇辉发布全新SWIFTACE YUKI篮球鞋
抢抓时尚潮流,花都匹克球品牌劲佰胜广州首店盛大开业!
内蒙古煤矸石及霞石新技术研究中心与亚洲煤炭协会签署合作协议推广新技术
不止《子胥过江》!心仪之城带着N种惊喜赴沪推介
光影承脉,荣耀绽放:欢娱影视2025爱奇艺尖叫载誉而归
佳能医疗INSIGHT全球同步上市,全国临床应用培训同步推进
“遇见贵州·陈皮香韵”(四川场)圆满落幕 烟火贵州深入人心
烟火黔境 陈皮香韵 ”遇见贵州・陈皮香旅”(河南场)圆满落幕
苏黔同心品香韵:“遇见贵州・陈皮香旅”(江苏场)游学体验之旅圆满成功
渤海人寿荣膺第五届防范非法金融活动短视频征集大赛两项大奖
国际前沿EVO+ ICL (V5)手术“落户”南昌普瑞眼科医院,江西近视患者迎来“加法手术”新选择
航天中心医院虞红医生12月份出诊时间
中国学生体育联合会第九届理事会第四次(扩大)会议在郑州西亚斯学院召开
秋冬支原体咳到“断气”?联合银黄清肺胶囊压制咳痰喘!
“蒙科聚”巴彦淖尔首届科技成果转化大赛落幕象好农业荣获佳绩
“肠道健康中国行”公益科普活动将于12月18日落地南通
“茅台时光”2025成都城市精选酒吧TOP榜隆重发布
谷安纪走进人民网乡村振兴大会:以硬核科技实力重塑健康主食新标杆
中国银行临沂分行市派第一书记:绘就乡村振兴新画卷
村级健康互助组成效显著,华润健康乡村公益项目探索新时代乡村健康治理“定州范式”
信而泰 OSPF 协议深度测试:破解路由收敛与一致性难题
2025年度全国地方金融法研究会会长论坛暨浙江省法学会金融法学研究会年会在杭州召开
第十届上海国际诗歌节顺利闭幕 ——出版主题诗集《AI时代・诗歌之道》
MARSTEK于法国蒙彼利埃国际可再生能源展重磅发布全新VENUS储能系统
崇州秋韵:金叶漫卷罨画池,诗魂长驻陆游祠
普托马尼片纳入中国医保:耐药结核治疗迈入“优效、普惠”新时代
大亚圣象饰面板2025广州设计周「栖心之境」圆满收官