当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek“开源周”第二天开源EP通信库

5个月前 (02-25)Deepseek最新资讯284

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。

据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。

DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。

DeepSeek发布公告截图


“DeepSeek“开源周”第二天开源EP通信库” 的相关文章

DeepSeek开源第二弹:EP通信库来了,有望再次降低计算消耗

DeepSeek开源第二弹:EP通信库来了,有望再次降低计算消耗

2月25日,DeepSeek在“开源周”的第二日开源了DeepEP通信库。DeepSeek表示,这是第一个用于MoE(专家)模型训练和推理的开源EP通信库。“高效、优化的全员沟通;节点内和节点间均支持...

贷款有望“无人”审批 DeepSeek料重塑银行信贷体系

贷款有望“无人”审批 DeepSeek料重塑银行信贷体系

本报记者 张佳琳凭借高性能、低成本和开源属性,DeepSeek大模型引发金融科技圈的高度关注,多家银行启动了深度研究测试,还有不少银行已完成本地化部署。某城商行董事长向记者直言:“以前由于成本太高,中...

全国人大新闻发布会:DeepSeek等公司兴起,展现中国科技发展创新性和包容性

全国人大新闻发布会:DeepSeek等公司兴起,展现中国科技发展创新性和包容性

十四届全国人大三次会议今天(3月4日)在人民大会堂举行新闻发布会,大会发言人娄勤俭就大会议程和人大工作相关问题回答中外记者提问。在回答人工智能发展相关问题时,娄勤俭表示,DeepSeek公司取得的重大...

中国电信新疆公司深挖DeepSeek融合应用 AI加“数”构筑智算服务新高地

中国电信新疆公司深挖DeepSeek融合应用 AI加“数”构筑智算服务新高地

“自从上线AI客服,依托DeepSeek大模型的强大语义理解能力,不仅能快速响应,精准解答,还能俄语、哈萨克语、维吾尔语等多语种对话,办事效率高多了。”霍尔果斯政务平台工作人员说。霍尔果斯市是“一带一...

放大 AI 商业价值,企业快成长 DeepSeek 行业深度应用创新论坛华北站圆满落幕

放大 AI 商业价值,企业快成长 DeepSeek 行业深度应用创新论坛华北站圆满落幕

 DeepSeek 一经问世便迅速赢得了众多用户的青睐,彼时,公众对 AI 的强烈需求直接体现在了注册数量上。经过多次迭代,DeepSeek-R1 和 DeepSeek-V3 现已发展成为能够进行深度...

小旺AI截图+DeepSeek:5MB工具如何颠覆传统截图软件?

小旺AI截图+DeepSeek:5MB工具如何颠覆传统截图软件?

在数字化办公场景中,截图工具是用户使用频率最高的效率软件之一。然而,传统截图软件长期面临功能单一、操作繁琐、资源占用高等痛点。近日,一款名为小旺AI截图的PC端工具正式上线,凭借仅5MB的轻量化设计、...