当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

8个月前 (02-25)Deepseek最新资讯427

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

全国高校首个!东南大学继DeepSeek又上线QwQ-32B

全国高校首个!东南大学继DeepSeek又上线QwQ-32B

本文转自【新华日报】;近日东大基于昇腾国产算力平台正式接入阿里最新开源模型QwQ-32B成为全国首个上线QwQ-32B服务的高校国产算力基座+头部大模型双轨融合将为教学科研注入更强的AI动能QwQ-3...

新里程:旗下医院均已上线DeepSeek应用

新里程:旗下医院均已上线DeepSeek应用

金融界4月21日消息,有投资者在互动平台向新里程提问:董秘您好,请问贵公司体内医院接入DeepSeek并进行本地化部署了吗?公司回答表示:目前公司旗下医院均已上线DeepSeek应用,将实现7*24运...

佛山市总开展DeepSeek智能实战应用系列培训

佛山市总开展DeepSeek智能实战应用系列培训

近日,广东省佛山市总工会举办DeepSeek智能实战应用系列公益培训班,吸引来自全市各机关事业单位、传统行业及家电家具、新能源、工业机器人、医药健康等行业职工参与。原定200人一场的培训规模因报名人数...

概念动态|恒润股份新增“DeepSeek概念”

概念动态|恒润股份新增“DeepSeek概念”

2025年4月2日,恒润股份(603985)新增“DeepSeek概念”。据同花顺数据显示,入选理由是:2025年3月18日闰六尺微信公众号发布,公司自主研发的DeepSeek大模型一体机:"...

DeepSeek:传统体育的未来

DeepSeek:传统体育的未来

传统体育的未来将在传承与创新中寻找平衡,既保留其文化精髓,又通过现代化手段焕发新的活力。以下是传统体育未来发展的主要方向:  1.文化传承与保护  非物质文化遗产保护:传统体育作为文化遗产的重要组成部...

美银:DeepSeek是中国股市的“阿里IPO时刻”

美银:DeepSeek是中国股市的“阿里IPO时刻”

DeepSeek“冲击波”影响广泛,人们认为其推出是AI领域的“斯普特尼克时刻”,但似乎更可能是中国股市的“阿里IPO时刻”。美国银行在2月12日的报告中指出,可能成为AI格局的游戏规则改变者:中国A...