性能再翻倍!科大讯飞联合华为在“飞星一号”上实现MoE模型大规模专家并行集群推理性能飞跃

2025-04-18 15:04:09     来源:

继不久前率先突破国产算力集群上MoE模型的大规模跨节点专家并行集群推理,公布业界首个基于国产算力的MoE模型训练推理方案后,科大讯飞与华为昇腾联合团队持续攻关,通过多种优化手段提升“飞星一号”平台上MoE模型集群推理的性能上限,并在近期实现了大规模专家并行集群推理性能翻番。这也再次证明了国内广泛部署的国产算力“敢打、能打”的深厚实力。

上一个版本算子和通信优化的基础之上,联合团队升级了适配MOE模型的PD分离+大规模专家并行系统解决方案,进行了以下技术创新工作:

●适配MoE的PD分离部署,通过定制集合通信协议,消除集合通信流量冲突,解决推理过程中Prefill阶段和Decode阶段的相互干扰,使得P实例和D实例均达到系统最优,性能提升20%+;

●实现国产算力上MTP多token预测技术,降低MTP层计算耗时,整体性能提升30%+;

●专家负载均衡算法再升级,多DP负载均衡,实现卡间负载均衡差异小于8%,集群推理吞吐性能提升30%+;

●创新性实现异步双发射技术,解决高并发下的高CPU负载问题,实现CPU和NPU的高效协同,降低服务请求调度耗时,系统性能提升10%。

基于上述解决方案的迭代与升级,通过在“飞星一号”平台上对星火MoE模型、DeepSeekV3/R1进行实测,实现了推理性能比上一个版本提升1倍,已逼近国产算力上MoE集群推理的性能上限,也大大加速了讯飞星火大模型的训练。

深度推理大模型讯飞星火X1也即将全新升级,作为业界唯一基于全国产算力训练的深度推理大模型,X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用能力上显著提升,以小一个数量级的参数规模,实现整体效果对标OpenAI o1和DeepSeek R1,这也再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力,期待大家的关注和体验。

 

标签:

猜你喜欢

助力霸王茶姬的中国战略公司——撬动,咨询界热议!
何永忠:浅谈国画的当代困境与未来发展之路
大家觉得在万洲金业炒黄金可靠吗
“绿色低碳·生态共赢”2025东南地区土壤与地下水修复技术交流会成功举办
世界地球日观察:德国威能如何用150年技术积淀,让每天都成为“减碳日”?
无痛放心种:西南口腔&科美勒建立中德无痛种植技术示范基地
中国东方航空集团有限公司冠名上海博物馆东馆第二特展厅揭牌仪式隆重举行
柔佛成东南亚数据中心新枢纽,Zenlayer助中企借柔新特区高效出海
春日万物生,教育正当时!平安银行私人银行2025“春日教育季”全面启动
贝因美爱加诠释成长奥秘,配方奶粉界的创新标杆
权威认可!小天鹅荣膺奥维云网三项行业大奖
一模之后成绩“逆风翻盘”几率有多大?统计结果出乎你的意料
赓续数千年,中医正青春,刘雁峰名医传承工作室落户东城中医医院
“上善健康 厚德济世”第五届健康专家研讨会圆满落幕
法立正正规吗
“关税激增!看这家国产企业如何利用‘零关税+全自研’优势破局”
高能环境三项成果入选“2024年生态环境保护实用技术装备和示范工程名录”
“兴”动水乡・浪漫“嘉”速|完美亲家绍兴、嘉兴相亲会温情落幕
春日万物生,教育正当时!平安银行私人银行2025“春日教育季”全面启动
NEPCON 电子制造嘉年华颁奖典礼4月23日上海世博展览馆邀您共襄盛举
一司一省一高校|国联基金走进对外经济贸易大学
“体重管理关键技术”专题论坛成功举办,推动精准营养干预迈向新高度
易派客九周年再启新程 数智赋能工业供应链高质量发展
注重饮食健康,书亦烧仙草获消费者持续认可
精准锁定消费群体,书亦烧仙草广受好评
深化政产学研合作,构建校地合作枢纽,共探产业绿色发展
PONY 1972面膜衣上新 随时随地冰敷“面膜”
广州附大中医院肿瘤科|全国肿瘤防治宣传周 名医行动
沪上寻味记:一次乐品上海餐饮消费券带来的惊喜体验
外卖精准投喂致高油烹饪上瘾,乐轻肝巧对暴增的轻肝减脂需求