当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

3个月前 (02-24)Deepseek最新资讯152

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

怎么检查deepseek的服务器状态?

怎么检查deepseek的服务器状态?

怎么检查deepseek的服务器状态?要检查DeepSeek的服务器状态,您可以访问以下链接查看最新的服务器状态信息:DeepSeek 服务器状态页面这个页面会显示服务器的运行状况,包括是否正在进行维...

DeepSeek对未来就业有何影响?

DeepSeek对未来就业有何影响?

据新民晚报报道:2月17日上午,民营企业座谈会在首都北京召开。参与此次座谈会的民营企业代表包括华为创始人任正非、DeepSeek创始人梁文锋、腾讯创始人马化腾、宇树科技创始人王兴兴、比亚迪创始人王传福...

润建股份:公司未与DeepSeek签署服务合作协议

润建股份:公司未与DeepSeek签署服务合作协议

2月16日,润建股份发布异动公告,公司自研“曲尺”人工智能开放平台对接和部署DeepSeek系列模型,赋能公司内部数智化转型,助力AI应用业务发展。但公司未与DeepSeek签署服务合作协议,与其未有...

DeepSeek开源新模型,数学推理能力大提升

DeepSeek开源新模型,数学推理能力大提升

赶在五一假期前夕,DeepSeek给我们送出一份惊喜大礼。延续一贯的开源节奏,DeepSeek在Hugging Face正式发布DeepSeek-Prover-V2,并同步上线模型卡及示例代码。此次共...

DeepSeek使用技巧:1个指令解锁DeepSeek的绘画功能

DeepSeek使用技巧:1个指令解锁DeepSeek的绘画功能

今天给大家分享一个很强的DeepSeek指令。它能过让DeepSeek直接在对话框里生成图片。之前分享过,这次是优化过后的版本。先发指令,再发提示的效果如下:优化过后的指令能显著提高成功率。如果你之前...

央国企上线DeepSeek “算力+AI”赋能工业发展

央国企上线DeepSeek “算力+AI”赋能工业发展

自2025年春节以来,DeepSeek的全新开源推理模型在全球范围内迅速走红,成为各界关注的焦点,同时引发国产AI发展浪潮。众多国内企业相继接入DeepSeek系列模型,以提升企业智能化水平,加速业务...