当前位置:首页 > Deepseek应用场景 > 正文内容

比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

6个月前 (04-11)Deepseek应用场景383

近日,硅基流动创始人袁进辉在华为云生态大会上宣布,硅基流动联合华为云基于 CloudMatrix 384超节点昇腾云服务和高性能推理框架 SiliconLLM,用大规模专家并行最佳实践正式上线 DeepSeek-R1。

该服务在保证单用户 20 TPS水平前提下,单卡 Decode吞吐突破 1920 Tokens/s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署 DeepSeek-R1的模型精度与 DeepSeek官方保持一致。


其中,通过架构的全面创新,基于新型高速总线架构的 CloudMatrix超节点集群在总算力、互联带宽、内存带宽上领先业界。

此前,硅基流动在大模型云服务平台 SiliconCloud首发推出了基于昇腾云的稳定生产级 DeepSeek-V3 & R1 推理服务,并支持模型私有化集群部署,这次合作推动基于国产算力的 DeepSeek-R1推理服务持续升级。


DeepSeek风暴席卷全球,特别是以其高效、低成本的 MoE架构为应对大模型推理挑战打开了局面。不过,如果没有强大的 AI Infra 技术能力,要想部署好 DeepSeek并非易事。

DeepSeek使用了大规模专家并行(Expert Parallelism,大 EP并行)的 MoE模型架构,若采用单机部署方案,最终的性能远不如 DeepSeek官方公布的部署方案,且至少有数倍成本差距。更具挑战的是,虽然 DeepSeek公开了大 EP 并行方案,但技术难度较大,业内还没有其他团队快速复现这一部署方法。

针对这些难题,硅基流动与华为云联合攻关实现了技术突破。我们在 CloudMatrix 384超节点昇腾云服务上部署 DeepSeek-R1 时采纳了大规模专家并行方案,通过多专家负载均衡和极致通信优化,实现高吞吐及更高性能,大幅提升了用户体验。同时,我们使用昇腾高性能算子库,以及硅基流动推理加速框架 SiliconLLM在模型、机制、算子上的协同优化,实现在国产算力上,不损失模型精度的情况下,获得 DeepSeek-R1 推理效率与资源利用率的显著提升。

硅基流动与华为云的合作不仅提供坚实的全国产软硬件体系部署方案,让 DeepSeek推理服务更经济高效,也展现了 AI 生态合作的强大能量。硅基流动将继续加深与华为云的联合创新,共同提升产品体验,加速模型在更多场景落地。


“比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1” 的相关文章

宝马年内将为多款中国在售新车接入DeepSeek功能

宝马年内将为多款中国在售新车接入DeepSeek功能

钛媒体App 4月23日消息,宝马集团董事长齐普策在今日举行的宝马发布会上宣布,今年内宝马将为多款中国在售新车接入DeepSeek功能,通过深度思考能力赋能以BMW智能个人助理为中心的人机交互体验。未...

车企扎堆接入DeepSeek,概念狂欢还是认知革命?|钛度车库

车企扎堆接入DeepSeek,概念狂欢还是认知革命?|钛度车库

原创 韩敬娴 钛媒体▎DeepSeek“上车”关键是看应用的领域,数据是否有效和丰富,场景对输出错误的容忍度。作者|韩敬娴编辑|李玉鹏本文首发于钛媒体APP技术革命的浪潮正加速席卷汽车行业。春节过后,...

人工智能赋能职业教育,北京八维集团引入DeepSeek

人工智能赋能职业教育,北京八维集团引入DeepSeek

在科技飞速发展的当下,人工智能(AI)已成为推动各行业变革的核心力量,职业教育领域自然也不例外。北京八维集团作为职业教育的领军者,敏锐洞察到人工智能带来的巨大机遇,近日正式引入先进的大语言模型 Dee...

DeepSeek在日常生活领域有哪些重要应用场景?

DeepSeek在日常生活领域有哪些重要应用场景?

DeepSeek在日常生活领域有哪些重要应用场景?<think> 嗯,我最近对DeepSeek这个AI助手有些兴趣,它能够进行各种复杂的任务,比如自然语言理解、问答、对话等等。最近我想了...

中国大模型产业“深水区”,李开复宣布全面拥抱“DeepSeek”

中国大模型产业“深水区”,李开复宣布全面拥抱“DeepSeek”

新浪科技讯 3月18日午间消息,零一万物发布万智企业大模型一站式平台,宣布全面拥抱DeepSeek,面向企业客户提供合规安全的一站式DeepSeek部署方案,涵盖DeepSeek模型部署、应用实践以及...

钉钉宣布全面接入DeepSeek系列模型

钉钉宣布全面接入DeepSeek系列模型

  2025年2月17日,钉钉正式启动第八届开工节,宣布全面接入DeepSeek系列模型,并推出四大AI礼包,为企业提供“开箱即用”的智能化解决方案,覆盖协同办公、数据处理、应用开发及专属模型定制等领...