NVIDIA宣布推出 NVIDIA Grove简化 Kubernetes 上的复杂 AI 推理

NVIDIA宣布推出 NVIDIA Grove，一个在 Kubernetes 集群上运行现代机器学习推理工作负载的 Kubernetes API。Grove 现已作为模块化组件集成至 NVIDIA Dynamo，它完全开源，可在 ai-dynamo/grove GitHub 库使用。

NVIDIA Grove 如何整体性编排推理负载：Grove 能够将多节点推理部署从单个副本扩展到数据中心规模，支持数万个 GPU。Grove 可将 Kubernetes 中的整个推理服务系统(例如预填充、解码、路由或任何其他组件)描述为单个自定义资源 (Custom Resource, CR)。

根据该单一配置文件，平台可协调层级化调度、拓扑感知的放置、多级自动扩缩容以及明确的启动顺序。您可以精准控制系统的行为方式，而无需将脚本、YAML 文件或自定义控制器拼接在一起。

Grove 最初是为了解决多节点 PD 分离推理系统的编排问题而开发的，它具有足够的灵活性，可以自然地映射到任何现实世界的推理架构，从传统的单节点聚合推理到具有多个模型的代理式管道。Grove 使开发者能够以简洁、声明式且与框架无关的方式定义复杂的 AI 堆栈。

Grove 原语：高性能推理框架使用 Grove 层级化 API 来表达角色特定的逻辑和多级扩展，从而在跨多种集群环境中实现一致且优化的部署。Grove 通过在其 Workload API 中使用三种层次化的自定义资源编排多组件 AI 工作负载，来实现这一点。

最终结果是多组件 AI 系统的协调部署，其中预填充服务、解码工作节点和路由组件按正确顺序启动，紧密放置在网络拓扑上以提高性能，并作为一个整体共同自愈。这防止了资源碎片化，避免了部分部署，并能够大规模稳定高效地运行复杂的模型服务管道。

如何使用 Dynamo 快速上手 Grove：原文将分享如何使用 Dynamo 和 Grove 通过 KV 路由部署组件部署 PD 分离服务架构。该设置使用 Qwen3 0.6B 模型，并演示了 Grove 通过独立的预填充和解码工作节点管理分布式推理工作负载的能力。

标签：

猜你喜欢

中国餐饮创新大会揭榜：鱼你在一起入选“中餐出海标杆TOP10”

双双超2000亿美元估值 Tether和维塔金是怎么炼成的

顺丰发布亚太大件产品矩阵，为中资及东南亚本土企业注入强劲动力

ASICS亚瑟士携手河村勇辉发布全新SWIFTACE YUKI篮球鞋

抢抓时尚潮流，花都匹克球品牌劲佰胜广州首店盛大开业！

内蒙古煤矸石及霞石新技术研究中心与亚洲煤炭协会签署合作协议推广新技术

不止《子胥过江》！心仪之城带着N种惊喜赴沪推介

光影承脉，荣耀绽放：欢娱影视2025爱奇艺尖叫载誉而归

佳能医疗INSIGHT全球同步上市，全国临床应用培训同步推进

“遇见贵州·陈皮香韵”（四川场）圆满落幕烟火贵州深入人心

烟火黔境陈皮香韵 ”遇见贵州・陈皮香旅”（河南场）圆满落幕

苏黔同心品香韵：“遇见贵州・陈皮香旅”（江苏场）游学体验之旅圆满成功

渤海人寿荣膺第五届防范非法金融活动短视频征集大赛两项大奖

国际前沿EVO+ ICL (V5)手术“落户”南昌普瑞眼科医院，江西近视患者迎来“加法手术”新选择

航天中心医院虞红医生12月份出诊时间

中国学生体育联合会第九届理事会第四次（扩大）会议在郑州西亚斯学院召开

秋冬支原体咳到“断气”？联合银黄清肺胶囊压制咳痰喘！

“蒙科聚”巴彦淖尔首届科技成果转化大赛落幕象好农业荣获佳绩

“肠道健康中国行”公益科普活动将于12月18日落地南通

“茅台时光”2025成都城市精选酒吧TOP榜隆重发布

谷安纪走进人民网乡村振兴大会：以硬核科技实力重塑健康主食新标杆

中国银行临沂分行市派第一书记：绘就乡村振兴新画卷

村级健康互助组成效显著，华润健康乡村公益项目探索新时代乡村健康治理“定州范式”

信而泰 OSPF 协议深度测试：破解路由收敛与一致性难题

2025年度全国地方金融法研究会会长论坛暨浙江省法学会金融法学研究会年会在杭州召开

第十届上海国际诗歌节顺利闭幕 ——出版主题诗集《AI时代・诗歌之道》

MARSTEK于法国蒙彼利埃国际可再生能源展重磅发布全新VENUS储能系统

崇州秋韵：金叶漫卷罨画池，诗魂长驻陆游祠

普托马尼片纳入中国医保：耐药结核治疗迈入“优效、普惠”新时代

大亚圣象饰面板2025广州设计周「栖心之境」圆满收官

热点图片

要闻

科技赋能千年文脉光峰科技获《鲁源奇妙夜》主办方致信盛赞
近日，光峰科技收到来自浙江大丰实业股份有限公司的正式表扬信。信中对光峰科技的项目
厦门眼科中心：从眼睛发现的健康警报，罕见眼病背后竟藏早期肺癌
近日，厦门眼科中心眼底病科凭借前沿诊疗技术与跨学科协作能力，从一个看似普通的视力
聪博纸尿裤：专注高性价比，守护宝宝肌肤健康
深夜里宝宝安睡的呼吸声、学步期孩子蹒跚地身影，都离不开一款舒适纸尿裤的默默守护。
司南导航新一代北斗高精度芯片模组，赋能智能驾驶与无人系统
近日，司南导航正式发布新一代北斗高精度定位芯片TC1720及基于该芯片的K601高精度定位
相约自然，氧护全民健康
椰风送爽，智聚博鳌。在聚焦健康中国新动能的海南博鳌亚洲论坛现场，郑州恒辉源新能源
高速激光切割赋能薄板钣金加工的技术突破
文／浙江嘉泰激光科技股份有限公司随着制造业向自动化、高精度、高效率方向转型，薄板
陕汽德龍G300 货运可靠伙伴赚钱坚实后盾~~“陕”耀卡车人
陕汽商用车陕汽德龍G300 轻卡卡友记录卡车生活
2026征兵在即，视力矫正抢先机！杭州之江眼科参军摘镜绿色通道已开启！
2026年上半年男兵征兵的全国征兵网报名通道，将于2025年12月5日24：00准时开启。随着
天山河谷·美哉伊犁丨8折优惠邀您住进雪原里的春天！
当第一片雪花落在天山之巅，伊犁河谷便化身童话：雪岭云杉披上银甲，六星街琴声悠扬，
健康经济＋新电商：开创属于全球家人无限风光的美好未来
当下，我们正面临着这样一个现实：国际上通常将50岁及以上人口称为银发人口。数据显示

NVIDIA宣布推出 NVIDIA Grove简化 Kubernetes 上的复杂 AI 推理

相关阅读

猜你喜欢

热点图片

要闻