当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2周前 (02-25)Deepseek最新资讯53

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

脉脉宣布接入DeepSeek-R1,用户数达1.2亿

脉脉宣布接入DeepSeek-R1,用户数达1.2亿

 职场社区平台脉脉宣布已接入DeepSeek-R1模型,旨在进一步优化人岗匹配,提升招聘效率。据悉,今年2月初,脉脉便已经接入DeepSeek-R1模型,并安排了测试部署工作。据悉,目前脉脉已拥有1....

「e公司观察」超级应用接连联姻DeepSeek “技术共同体式”互联互通或成新趋向

「e公司观察」超级应用接连联姻DeepSeek “技术共同体式”互联互通或成新趋向

腾讯和百度两大超级应用,接连在各自的基本盘业务中接入DeepSeek的AI技术,这对于我们观察中国互联网的演进趋势提供了重要窗口。从公司层面来看,两家巨头都有自研大模型,引入第三方开源模型意味着它们都...

华东院成功接入DeepSeek大模型搭建林草知识库框架

华东院成功接入DeepSeek大模型搭建林草知识库框架

近日,国家林草局华东院成功接入DeepSeek本地化大模型平台,搭建林草知识库框架,推动林草调查监测和规划工作迈入人工智能深度赋能的新阶段。随着国内外大语言模型的不断涌现,科技发展迎来新一轮的“数字红...

九江市教育局举办“DeepSeek等人工智能技术赋能教育图景”专题讲座

九江市教育局举办“DeepSeek等人工智能技术赋能教育图景”专题讲座

为积极响应国家教育数字化战略行动,进一步推动人工智能技术与教育教学的深度融合,提升我市教育现代化水平,市教育局精心筹备并举办了 “DeepSeek等人工智能技术赋能教育图景” 专题讲座。市教育局在家班...

双良节能全面启动DeepSeek全场景应用 以AI驱动产业升级

双良节能全面启动DeepSeek全场景应用 以AI驱动产业升级

2月17日,双良节能全面启动DeepSeek全产业全场景应用计划。基于DeepSeek-R1大模型的高效推理能力与成本优势,通过本地化部署实现AI与业务的深度耦合,双良将在智能制造、清洁能源等核心产业...

大连银行牵手DeepSeek开启金融智能化转型新篇章

大连银行牵手DeepSeek开启金融智能化转型新篇章

在数字化时代的浪潮下,DeepSeek大模型的迅速崛起正深刻改变着各个行业的发展格局,在银行业更是掀起了一场技术变革。日前,大连银行凭借多年来在人工智能领域的精耕细作和对大模型技术的沉淀积聚,依托开源...