当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

2周前 (02-26)Deepseek最新资讯57

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

DeepSeek将于下周陆续开源5个代码库 每日解锁新内容

DeepSeek将于下周陆续开源5个代码库 每日解锁新内容

 DeepSeek今日宣布,接下来一周,会陆续来源5个代码库,每日都有新内容解锁,进一步分享新的进展。DeepSeek介绍,当前在线服务的模块已经经过测试、部署完备,可以投入生产环境。公司将...

汇正财经预测:DeepSeek的出现,有望让AI终端落地

汇正财经预测:DeepSeek的出现,有望让AI终端落地

2025年1月20日,DeepSeek 发布并开源DeepSeek-R1模型,其在极少标注数据下通过强化学习极大提升推理能力,在各项任务上性能比肩OpenAIo1正式版,获英伟达等众多国内外科技巨头支...

贵阳贵安:运用DeepSeek赋能 在企业和群众两端发力

贵阳贵安:运用DeepSeek赋能 在企业和群众两端发力

3月7日,在贵阳贵安DeepSeek部署应用新闻发布会上,贵阳市大数据局局长、贵安新区大数据和科创局局长张雪蓉介绍,在运用DeepSeek赋能方面,贵阳贵安始终以“技术落地、服务见效”为目标,在企业和...

DeepSeek引领AI风潮,酒店业或迎新变革

DeepSeek引领AI风潮,酒店业或迎新变革

近期,DeepSeek不仅登上了热搜榜,还强势占据了各大应用榜单的榜首,引发了广泛关注。DeepSeek的崛起也为酒店行业带来了新的启示。面对行业竞争白热化与消费者需求升级,AI技术成为破局关键,如何...

微信小程序使用DeepSeek的方法有哪些?

微信小程序使用DeepSeek的方法有哪些?

大家好,我是沐颜,专注私域流量变现。我的陪跑项目👉🏻 《超级个体合伙人》我的网创资源站👉🏻《搞钱项目资源》每天分享靠谱的副业项目,感兴趣的朋友,可以点个关注。设定清晰的目标是成功的第一步。当你知道自己...

众多产业行业与DeepSeek“联姻结对”,将为我们带来什么?

众多产业行业与DeepSeek“联姻结对”,将为我们带来什么?

新华社北京2月17日电 DeepSeek在多家医院完成本地化部署;微信测试接入DeepSeek;部分地区政务系统已接入……众多行业产业与DeepSeek“联姻结对”的消息接踵而至,令人不禁想问:AI正...