当前位置：首页 > Deepseek最新资讯 > 正文内容

基于华为昇腾训练性能不输英伟达！自家模型爆料：DeepSeek-R2本月要发布

2个月前 (08-12)Deepseek最新资讯261

　　快科技8月12日消息，ChatGPT-5已经发布，那么国产大模型DeepSeek大版本更新也就不远了。

　　从网友向DeepSeek提出的问题看，该模型给出的答案是，DeepSeek-R2预计将在2025年8月15日至8月30日之间发布。

　　在这样的背景下，国产算力链多家公司股价出现了大涨，比如寒武纪直接今天20cm涨停，股价创历史新高，市值突破3550亿元。

　　按照之前的说法，DeepSeek-R2大模型将会采用一种更先进的混合专家模型（MoE），其结合了更加智能的门控网络层（Gating Network）以优化高负载推理任务的性能。

　　有分析师预计，DeepSeek-R2的定价可能显著低于OpenAI同类产品，预示着其可能颠覆现有AI服务的定价模式。

　　此外，还有相关消息显示，DeepSeek-R2预计比GPT-4成本下降97%；并且是在昇腾卡上做的训练，主打一个全方位全产业链的自主可控。

　　据相关人士透露的情况，DeepSeek-R2的总参数量可能会达到1.2万亿，比DeepSeek-R1的6710亿参数增加大约一倍。

　　据华为实验室统计，这个性能相当于英伟达上一代A100训练集群的91%左右deepseek。至于这些是不是真实的，还有待观察，但看起来确实更强大、更自主了。原文出处：基于华为昇腾训练性能不输英伟达！自家模型爆料：DeepSeek-R2本月要发布，感谢原作者，侵权必删！

标签: deepseek

返回列表

　　张骏绷不住了：狠狠共情DeepSeek!这AI怎么比我还内耗！ #AI #AI前线 #人工智能 #内耗 #脱口秀 #DeepSeek #元宝 #张骏 #脱口秀和Ta的朋友们 @微信时刻...

　　DeepSeek作为国内领先的人工智能大模型研发企业，其产业链布局广泛，涵盖资本支持、算力基础设施、数据服务及多行业场景合作等多个层面。　　在资本层面，多家机构通过...

　　近日，美国《时代》杂志（TIME）公布了备受瞩目的2025年度最佳发明榜单，TCL雷鸟创新与苹果、华为、比亚迪deepseek、DeepSeek等多家全球科技企业的突破性产品上榜。...

　　2025年，中国消费市场步入深度结构化调整阶段。伴随疫后经济与社会形态的变迁，行业整体从追求规模扩张转向精细化、分层化运营的新范式。消费者行为理性分化，企业组织持续重构，人才需求结构同...

　　黑神话悟空再次登上新闻联播，和DeepSeek一起被点名表扬，近日，《黑神话：悟空》再次登上中央广播电视总台《新闻联播》的官方抖音号，并受到主持人严於信的特别提及。...

　　IT之家查询获悉，英特尔 Gaudi 2E 采用 7nm 制程，配备 96GB HBM2E 内存、48MB SRAM，具备 2.4TB 总内存带宽，针对随机访问deepseek、线性访...

基于华为昇腾训练 性能不输英伟达！自家模型爆料：DeepSeek-R2本月要发布