当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

5个月前 (02-24)Deepseek最新资讯255

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

富途正式接入DeepSeek

富途正式接入DeepSeek

3月21日,富途在香港湾仔会议展览中心举办的“富途投资展”上宣布,将正式接入DeepSeek-R1,并介绍多个人工智能(“AI”)升级的产品功能,以顶尖投资工具赋能零售投资者,进一步实现普惠金融的愿景...

「远东3.0新时代」远东宏信完成DeepSeek本地化部署,开启智能化应用之路

「远东3.0新时代」远东宏信完成DeepSeek本地化部署,开启智能化应用之路

人工智能正以前所未有的深度和广度重塑全球经济格局,成为驱动商业升级的核心引擎。在科技与金融深度融合的今天,远东宏信以战略眼光拥抱变革,率先完成DeepSeek大模型的本地化部署,标志着公司在智能化转型...

广东全省推进DeepSeek部署,开启AI智能服务新篇章!

广东全省推进DeepSeek部署,开启AI智能服务新篇章!

拥抱AI浪潮 加速AI赋能近期,AI系统DeepSeek依托先进的深度学习算法和强大的数据处理能力火热出圈。中国电信广东公司积极拥抱AI浪潮,依托天翼云强大的算力资源和技术优势,为DeepSeek在广...

引力传媒:公司已完成DeepSeek-R1的本地化部署

引力传媒:公司已完成DeepSeek-R1的本地化部署

每经AI快讯,有投资者在投资者互动平台提问:请问贵公司是真的已经完成deepseek本地化部署了吗引力传媒(603598.SH)2月24日在投资者互动平台表示,公司已完成DeepSeek-R1的本地化...

湖南大模型+DeepSeek 助力智能诊疗

湖南大模型+DeepSeek 助力智能诊疗

湖南日报3月12日讯(全媒体记者 王铭俊)记者今天从智慧眼科技股份有限公司获悉,该公司大模型砭石与DeepSeek的本地化部署应用,已在长沙市第一医院落地。智慧眼人工智能研究院院长胡频博士介绍,“砭石...

从0到1玩转DeepSeek,小白也能秒变AI高手

从0到1玩转DeepSeek,小白也能秒变AI高手

一、DeepSeek 初印象在人工智能飞速发展的今天,各类 AI 工具层出不穷,而 DeepSeek 无疑是其中备受瞩目的新星 。它以强大的功能和对零基础用户的友好度,迅速在 AI 领域崭露头角,成为...