当前位置：首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日发布高性能通用矩阵乘法库

8个月前 (02-26)Deepseek最新资讯443

新京报贝壳财经讯（记者罗亦丹）北京时间2月26日，DeepSeek进行了其开源周第三日的发布——DeepGEMM，一个支持密集和MoE（专家混合模型）GEMM（通用矩阵乘法）的FP8 （8位浮点数）GEMM库，为V3/R1训练和推理提供支持。

据了解，通用矩阵乘法是许多高性能计算任务的核心，所以其性能优化也是大模型降本增效的重点。

DeepSeek表示，DeepGEMM在Hopper GPU（一种英伟达GPU架构）上最高可达到1350+FP8TFLOPS（每秒万亿次浮点运算），并且像教程一样简洁，可完全即时编译，其核心逻辑只有约300行代码，且在大多数矩阵尺寸上均优于专家调优的内核，并支持密集布局和两种MoE布局。

标签: DeepSeek

返回列表

上一篇：DeepSeek单日处理量等于镇江全市公务员10年工作量，为何有争议？

下一篇：DeepSeek已经给儿童看病了业内：“D医生”不为建议担责

“DeepSeek开源周第三日发布高性能通用矩阵乘法库” 的相关文章

玉禾田：将Deepseek 671B模型接入大管家平台

玉禾田：将Deepseek 671B模型接入大管家平台

金融界4月1日消息，有投资者在互动平台向玉禾田提问：董秘你好请问贵公司是否部署Deepseek,如果有具体运用在哪方面？公司回答表示：公司已将Deepseek 671B满血模型接入大管家平台，并已在构...

脉脉宣布接入DeepSeek-R1，用户数达1.2亿

脉脉宣布接入DeepSeek-R1，用户数达1.2亿

　职场社区平台脉脉宣布已接入DeepSeek-R1模型，旨在进一步优化人岗匹配，提升招聘效率。据悉，今年2月初，脉脉便已经接入DeepSeek-R1模型，并安排了测试部署工作。据悉，目前脉脉已拥有1....

DeepSeek震撼硅谷！中国算力脱胎换骨

DeepSeek震撼硅谷！中国算力脱胎换骨

2025年，中国AI大模型DeepSeek的横空出世，不仅以低成本高性能，颠覆全球AI竞争格局，不仅震撼了美国硅谷和华尔街，而且与鲲鹏计算平台的硬件突破，形成软硬协同的国产算力自主化的新范式。鲲鹏以软...

医学博主自嘲“天塌了”：患者查询DeepSeek后“质疑”治疗方案，而且它是对的

医学博主自嘲“天塌了”：患者查询DeepSeek后“质疑”治疗方案，而且它是对的

昨（22）日，广东一名医学博主上网发帖称，自己为病人开出治疗方案，对方查询DeepSeek后称有问题，自己“气得又查了一遍医学指南”，结果发现医学指南更新了，自嘲感觉“天塌了”。DeepSeek真的这...

DeepSeek杀入金融科技圈

DeepSeek杀入金融科技圈

低成本、低门槛、高效能的优势，加之开源策略支持本地私有化部署，让DeepSeek在近期席卷金融科技圈，从国有大行、互联网大厂金融科技公司到消费金融公司、第三方支付机构、上市金融科技企业纷纷宣布接入De...

DeepSeek鲶鱼效应，掀起AI上车狂潮｜封面故事：AI汽车赛道起跑

DeepSeek鲶鱼效应，掀起AI上车狂潮｜封面故事：AI汽车赛道起跑

汽车纵横全媒体最近DeepSeek狂潮席卷全球，掀起了新一轮汽车行业企业AI热潮。它打破了传统大模型依赖大算力的路径，加速AI技术普及和普惠。AI赋能汽车全价值链，已成为驱动汽车智能化变革的核心引擎和...