当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek-V3.2-Exp第一时间上线华为云

2周前 (10-02)Deepseek最新资讯94

  2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。华为云第一时间完成对 DeepSeek-V3.2-Exp 模型的适配工作deepseek,最大可支持160K长序列上下文长度。目前,该模型已正式上架华为云大模型即服务平台 MaaS,为企业及开发者提供模型体验和 API 服务。

  华为云ModelArts推理平台基于CloudMatrix384基础设施,为DeepSeek-V3.2-Exp模型提供稳定、高可靠推理服务。ModelArts推理平台能够根据实际负载需求,按需供给和分配模型推理算力资源,实现资源分时复用与灵活扩缩容。针对DeepSeek-V3.2-Exp 模型,此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。

  访问华为云官网首页——导航菜单“大模型”——“DeepSeek-V3.2-Exp”模型“立即体验”,进入大模型服务平台模型体验页面,选择“DeepSeek-V3.2-Exp”模型体验。原文出处:DeepSeek-V3.2-Exp第一时间上线华为云,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek-V3.2-Exp第一时间上线华为云” 的相关文章

刚刚,DeepSeek-R1论文登上Nature封面,通讯作者梁文锋

刚刚,DeepSeek-R1论文登上Nature封面,通讯作者梁文锋

  如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种『推理』与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。在本周...

渤海人寿7.8纪实:爱与责任 守护美好

渤海人寿7.8纪实:爱与责任 守护美好

  2025年“7.8 全国保险公众宣传日”期间,渤海人寿秉持金融工作的政治性、人民性,以“爱和责任 保险让生活更美好”为主题,全面开展7.8系列宣传与文化推进活动。从红色文化活动开展、保...

北大拿下2篇最佳论文,DeepSeek实习生立功,华人横扫这场AI顶会

北大拿下2篇最佳论文,DeepSeek实习生立功,华人横扫这场AI顶会

  智东西7月31日报道,昨天,第63届计算语言学协会年会(ACL 2025)在奥地利召开。作为自然语言处理领域最具学术影响力的会议之一,本届ACL吸引了超过8300多篇论文的投稿,中国大...

华为云:第一时间完成DeepSeek-V3.2-Exp模型适配工作

华为云:第一时间完成DeepSeek-V3.2-Exp模型适配工作

  华为云第一时间完成对DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。   目前,该模型已正式上架华为云大模型即服务平台MaaS,...

DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行

DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行

  9月18日,梁文锋作为通讯作者,带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。   《自然》杂志指出,如此总结DeepSee...

用AI联通丨当“政务+AI”遇上DeepSeek

用AI联通丨当“政务+AI”遇上DeepSeek

  在数字化浪潮席卷全球的今天,人工智能正以前所未有的速度重塑各行各业的发展格局。今年3月,上海联通携手自贸区临港新片区企业服务中心,依托国内领先的深度求索(DeepSeek)大语言模型,...