当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

8个月前 (02-25)Deepseek最新资讯385

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

中国石油大学(华东)“i石大”版满血DeepSeek正式上线

中国石油大学(华东)“i石大”版满血DeepSeek正式上线

2月26日,中国石油大学(华东)宣布,属于石大人自己的“i石大”版满血DeepSeek大模型——AI智能助手正式上线。石大师生可通过学校微信企业号或直接点击PC端链接进入使用,随时随地体验DeepSe...

百度首页上线DeepSeek入口链接-AI搜索DeepSeek满血版”即可体验

百度首页上线DeepSeek入口链接-AI搜索DeepSeek满血版”即可体验

记者获悉,百度搜索目前已全量上线DeepSeek满血版并提供联网服务,其中PC端开放1小时超千万人使用。对比其它接入DeepSeek产品,百度搜索在首页搜索框下方点击“AI搜索DeepSeek满血版”...

为什么作家阿来不用DeepSeek

为什么作家阿来不用DeepSeek

日前,作家、四川省作家协会主席阿来亮相复旦大学,在“人是出发点,也是目的地”主题研讨会间隙接受文汇报记者专访。原标题:《为什么作家阿来不用DeepSeek》...

DeepSeek大模型席卷金融业,银行、券商、基金、保险竞相接入

DeepSeek大模型席卷金融业,银行、券商、基金、保险竞相接入

近期,DeepSeek大模型在金融业掀起一股热潮,多家金融机构纷纷宣布接入或部署该模型。据不完全统计,目前已有16家券商、10余家公募基金公司以及多家银行和保险机构宣布接入或部署DeepSeek大模型...

普通人如何逃离DeepSeek幻觉陷阱

普通人如何逃离DeepSeek幻觉陷阱

DeepSeek横空出世,我们和人工智能的关系也随之进入新时代。但对于许多人来说,与AI的蜜月期还没有结束,幻觉问题就不合时宜地来预警。近期一条“80后死亡率突破5.2%”的假新闻广为流传,据上海网络...

中信证券:DeepSeek,当前AI产业链投资催化剂

中信证券:DeepSeek,当前AI产业链投资催化剂

中信证券发布研报称,认为Deepseek在模型训练成本降低方面的最佳实践,料将刺激科技巨头采用更为经济的方式加速前沿模型的探索和研究,同时将使得大量AI应用得以解锁和落地。算法训练带来的规模报酬递增效...