当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

2周前 (02-26)DeepSeek技术交流43

一开始,我还以为 DeepSeek 会走传统路线,比如大厂常见的蒸馏技术,搞个小参数的 Flash 模型。毕竟这种方法能有效降低计算需求,但缺点也很明显,就是小模型再怎么优化,和大模型比起来,性能还是会有损失 结果 DeepSeek 完全没按套路出牌,它不是去压缩模型,而是换了个角度,直接假设未来算力足够,然后想办法更高效地用好现有显卡架构。换句话说,不是缩小参数规模,而是在同等规模下优化计算方式,让计算更具性价比 这种思路比纯工程优化要“硬核”得多。一般来说,搞小模型是比较务实的工程方案,但 DeepGEMM 这种技术驱动的做法更有延展性。它不仅和小模型方法兼容,而且即使以后显卡更强、模型规模更大,这套技术依然能继续用,不会过时

“DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?” 的相关文章

全干货实操!DeepSeek-R1终极攻略:99%的人不知道的高效玩法大公开!

全干货实操!DeepSeek-R1终极攻略:99%的人不知道的高效玩法大公开!

最近,号称“中国版GPT-4o”的DeepSeek-R1火爆全网!朋友圈、科技媒体、甚至程序员社群都在刷屏讨论。但很多小伙伴反馈:“明明功能超强,为什么我用起来总翻车?”  答案很简单: 你...

谁是“造物主”?关于DeepSeek的冷思考

谁是“造物主”?关于DeepSeek的冷思考

原创 小复 复旦大学出版社我们正在经历一场静默的“创世记”:AI生成媲美人类的作品基因编辑重塑生命密码元宇宙构建平行宇宙究竟谁才是这个时代的“造物主”?2025年1月20日,幻方量化旗下AI公司深度求...

脉脉宣布接入DeepSeek-R1,用户数达1.2亿

脉脉宣布接入DeepSeek-R1,用户数达1.2亿

 职场社区平台脉脉宣布已接入DeepSeek-R1模型,旨在进一步优化人岗匹配,提升招聘效率。据悉,今年2月初,脉脉便已经接入DeepSeek-R1模型,并安排了测试部署工作。据悉,目前脉脉已拥有1....

百万年薪!DeepSeek带火AI相关岗位

百万年薪!DeepSeek带火AI相关岗位

2025年春节,中国人工智能大模型DeepSeek在全球引发轰动。DeepSeek的崛起也让相关领域的人才在这个春招季炙手可热。有企业开出百万年薪!据南方日报报道,在2月的深圳市南山区新春大型招聘活动...

亚信科技助力广东联通全面接入DeepSeek,以国产AI赋能湾区转型

亚信科技助力广东联通全面接入DeepSeek,以国产AI赋能湾区转型

亚信科技助力广东联通全面接入DeepSeek,以国产AI赋能湾区转型###  近日,亚信科技依托自主研发的渊思·通用人工智能与认知增强平台(TAC MaaS)助力广东联通AI应用全面接入DeepSee...

DeepSeek成“流量密码”背后:赚钱新门路与岗位替代者

DeepSeek成“流量密码”背后:赚钱新门路与岗位替代者

DeepSeek自发布以来持续火爆,不少车企、手机商、互联网大厂等纷纷宣布与其合作,还有不少博主从中发现流量红利。上游新闻(报料邮箱:cnshangyou@163.com)记者注意到,截至发稿,小红书...