当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

3个月前 (02-25)Deepseek最新资讯166

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

科蓝软件:已成功将DeepSeek-R1模型整合至公司魔聚平台

科蓝软件:已成功将DeepSeek-R1模型整合至公司魔聚平台

人民财讯3月5日电,科蓝软件(300663)3月5日在互动平台表示,公司已成功将DeepSeek-R1模型整合至公司的人工智能应用平台——魔聚平台。具体来说,魔聚平台成功部署并全面投入使用了DeepS...

特斯联特AI接入满血DeepSeek,为职场数智化转型注入新动能

特斯联特AI接入满血DeepSeek,为职场数智化转型注入新动能

2025年《政府工作报告》明确提出,要持续推进“人工智能+”行动,推动大模型技术向垂直场景渗透。在数字技术与实体经济深度融合的浪潮下,人工智能正加速重构职场办公的底层逻辑。作为AIoT领域的领军企业,...

北科学堂:智能助手DeepSeek助力青少年成长

北科学堂:智能助手DeepSeek助力青少年成长

2025年3月15日,科技教师志愿者、北京科学中心名师工作室成员赵丽岩老师为北科学堂的小学员带来了一场精彩的课程——智能助手DeepSeek助力青少年成长。本次课程积极响应《北京市推进中小学人工智能教...

​快手可灵AI已全面接入DeepSeek-R1

​快手可灵AI已全面接入DeepSeek-R1

快手可灵AI已全面接入DeepSeek-R1。在视频生成、图片生成等场景下,用户可通过DeepSeek协助生成或者优化提示词。在文生视频场景下,DeepSeek灵感版还可以和此前的“灵感词库”功能联动...

DeepSeek干什么用的?探索人工智能技术的前沿应用

DeepSeek干什么用的?探索人工智能技术的前沿应用

标题:DeepSeek干什么用的?探索人工智能技术的前沿应用关键词:DeepSeek,人工智能,技术创新,大数据,机器学习,智能分析,产业升级描述:深入了解DeepSeek,这款人工智能应用是如何帮助...

这场科技盛会将启幕,为何DeepSeek让业内兴奋又“焦虑”

这场科技盛会将启幕,为何DeepSeek让业内兴奋又“焦虑”

“这次DeepSeek横空出世,让AI从业者既兴奋又‘焦虑’。”上海库帕思科技有限公司CEO黄海清认为,DeepSeek最核心的点在于技术创新,为中国大模型公司和产业的发展提供了一个较好的“换道超车”...