DeepSeek致谢腾讯技术团队,DeepEP开源通信框架性能显著提升

腾讯技术团队对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升,优化后的通信框架性能在RoCE网络环境提升100%,IB网络环境提升30%,为企业开展AI大模型训练提供更高效的解决方案。据悉,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理。DeepEP是一个为专家混合(MoE)和专家并行(EP)量身定制的通信库,支持低精度运算,包括FP8。腾讯星脉网络团队在DeepEP开源后展开技术攻关,解决了两大关键瓶颈问题,实现了性能翻倍,反哺到IB网络时更使原有通信效率再提升30%。目前,该技术已成功应用于腾讯混元大模型等项目的训练推理,并在腾讯星脉与H20服务器构建的环境中展现出出色的通用性。

话题追踪

千问3登顶全球权威开源模型榜

雷峰网 | 2025-05-07 17:40

本信息来自互联网,不代表导读网立场,如若转载,请注明出处:http://www.frfey.com/news/55954/

(4)

导读信息推荐

发表回复

本站作者后才能评论

    联系我们

    邮件:sooting2000@qq.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们