当前位置:首页 > Deepseek最新资讯 > 正文内容

华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效

  技术层面:1)DeepSeek Spare Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。根据各领域性能公开评测集结果(通用、搜索、代码、代码智能体、数学),DeepSeek-V3.2-Exp表现与V3.1-Terminus基本持平;2)开源TileLang与CUDA两种算子,TileLang由北大团队研发,专为简化高难度GPU算子开发而设计,将成为替代主流OpenAI领域特定语言Triton的有力备选,TileLang将调度空间与数据流解耦,使开发者能够直观地控制数据在硬件中的流动,根据TileLang在GitHub的说明文档,不仅支持英伟达CUDA,还已扩展支持华为昇腾等国产芯片。DeepSeek使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段deepseek,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。

  受益于新模型服务成本大幅降低,API调用价格相应下调。目前DeepSeek-V3.2-Exp API价格为输入0.2元/百万tokens(缓存命中),2元/百万tokens(缓存未命中),输出3元/百万tokens。

  新价格政策下开发者调用DeepSeek API的成本将降低50%以上。我们认为,DeepSeek-V3.2-Exp在技术层面探索了新的稀疏注意力机制,推动中国算力生态协同创新与演进,进一步将模型与算法层面的创新,与中间层的编译语言与更底层的计算芯片协同起来,推动中国算力生态的成长。模型发布后华为昇腾和寒武纪均第一时间宣布完成适配工作,表明国产AI算力生态已进入模型与芯片协同设计阶段。相关公司:神州数码、寒武纪、品高股份、北京利尔、安博通、优刻得、浪潮信息、紫光股份、超讯通信、首都在线。

  1)下游预算限制信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。原文出处:华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效,API同步降价-251012,感谢原作者,侵权必删!

标签: deepseek

“华安证券-计算机行业周报:DeepSeek~V3.2~Exp 发布,训练推理提效” 的相关文章

DeepSeek更新,增加这项功能!

DeepSeek更新,增加这项功能!

  值得一提的是,近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。   7月31日,据国际开源社区Hugging-Fa...

小摩:AI和DeepSeek的崛起提升三大电讯商潜力 首选中国电信

小摩:AI和DeepSeek的崛起提升三大电讯商潜力 首选中国电信

  摩根大通发布研报称,中国电讯业营运商的股价在2019年至2024年间表现超过恒指,差距达到双位数,而本年迄今的表现优于市场deepseek。该行指出,前三大电信营运商不仅提供具吸引力的...

朱啸虎称DeepSeek影响力被低估,开源AI生态对人类至关重要

朱啸虎称DeepSeek影响力被低估,开源AI生态对人类至关重要

  【#朱啸虎称大家低估了DeepSeek影响力#】由硅星人与北京中关村科学城创新发展有限公司、北京中关村创业大街科技服务有限公司联合发起的“AI 创造者嘉年华”上,金沙江创投主管合伙人朱...

住建部GBT50500-2024《建设工程工程量清单计价标准》应用及DeepSe

住建部GBT50500-2024《建设工程工程量清单计价标准》应用及DeepSe

  2024年12月30日住建部正式发布《建设工程工程量清单计价标准》GB/T50500-2024,新版《清单计价标准》的出台为工程造价精细化管理带来一场新的革命,同时也给各单位相关管理人...

服务行业数智化,共创AI新时代 华为中国政企用户峰会2025成功举办

服务行业数智化,共创AI新时代 华为中国政企用户峰会2025成功举办

  7月24日,以“倾听·践行 服务行业数智化 共创AI新时代”为主题的华为中国政企用户峰会2025在山东青岛举办,与会的行业智库、客户和伙伴针对智能时代ICT服务的发展趋势与行业热点发表...

每日互动方毅出席第二届京浙英才百人会:让AI把私有数据用起来

每日互动方毅出席第二届京浙英才百人会:让AI把私有数据用起来

  8月23日,以“AI+:深度赋能产业变革——人工智能应用的新生代力量”为主题的第二届京浙英才百人会在杭州举行。本届活动汇聚了京浙两地政产学研用投等各界代表,深入交流探讨人工智能技术落地...