当前位置：首页 > DeepSeek技术交流 > 正文内容

DeepSeek 又上新！DeepGEMM 发布，有哪些突破点值得一看？

8个月前 (02-26)DeepSeek技术交流572

一开始，我还以为 DeepSeek 会走传统路线，比如大厂常见的蒸馏技术，搞个小参数的 Flash 模型。毕竟这种方法能有效降低计算需求，但缺点也很明显，就是小模型再怎么优化，和大模型比起来，性能还是会有损失结果 DeepSeek 完全没按套路出牌，它不是去压缩模型，而是换了个角度，直接假设未来算力足够，然后想办法更高效地用好现有显卡架构。换句话说，不是缩小参数规模，而是在同等规模下优化计算方式，让计算更具性价比这种思路比纯工程优化要“硬核”得多。一般来说，搞小模型是比较务实的工程方案，但 DeepGEMM 这种技术驱动的做法更有延展性。它不仅和小模型方法兼容，而且即使以后显卡更强、模型规模更大，这套技术依然能继续用，不会过时

标签: DeepSeek DeepGEMM

返回列表

上一篇：怎么评估 Deepseek 模型的性能？

下一篇：Deepseek的「深度思考」和「联网搜索」有什么区别，怎么使用？

“DeepSeek 又上新！DeepGEMM 发布，有哪些突破点值得一看？” 的相关文章

DeepSeek如何嵌入Excel和Wps？一键完成

DeepSeek如何嵌入Excel和Wps？一键完成

昨天兰色的表格助手正式开放，强大的功能让很多同学直呼好用。想让Excel帮你做什么，只需要说句话即可。合并表格。三个列不同的表格10秒可以合并成一个表格很复杂的地址拆分，对于表格助手也是小菜一碟数据分...

接入DeepSeek，跨境外贸就能躺赢？｜钛媒体

接入DeepSeek，跨境外贸就能躺赢？｜钛媒体

“身边的跨境老板几乎都在关注大模型动态，想着怎样用大模型提效工作流和运营能力。”孙杨是一家中小型跨境商家的老板，他对钛媒体出海参考说道。DeepSeek爆火后，以孙杨为代表的跨境老板尝试了各种Deep...

DeepSeek-R2大模型上线在即,当贝AI或率先接入

DeepSeek-R2大模型上线在即,当贝AI或率先接入

4月30日凌晨DeepSeek更新Prover-V2大模型,据多方消息透露,国内AI技术领军企业深度求索(DeepSeek)计划于5月发布新一代旗舰大模型DeepSeek-R2,预计比GPT-4成本下...

DeepSeek有望助力全球南方国家跨越数字鸿沟

DeepSeek有望助力全球南方国家跨越数字鸿沟

“我认为DeepSeek有潜力帮助全球南方国家缩小数字鸿沟并加速现代化。”日前在南非举行的数字化转型峰会上，南非人工智能企业Matogen首席执行官雅各布斯·艾蒂安说。随着全球数字化进程加速，...

宝马年内将为多款中国在售新车接入DeepSeek功能

宝马年内将为多款中国在售新车接入DeepSeek功能

钛媒体App 4月23日消息，宝马集团董事长齐普策在今日举行的宝马发布会上宣布，今年内宝马将为多款中国在售新车接入DeepSeek功能，通过深度思考能力赋能以BMW智能个人助理为中心的人机交互体验。未...

DeepSeek：改变行业格局的技术革命-DeepSeek的未来前景

DeepSeek：改变行业格局的技术革命-DeepSeek的未来前景

标题：DeepSeek：改变行业格局的技术革命关键词：DeepSeek,人工智能,数据分析,技术创新,行业应用,智能化描述：深度探索DeepSeek的广泛应用，如何在各个行业中带来创新和效率的飞跃，提...