当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

4个月前 (03-19)Deepseek应用场景253

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

从钓鱼台到博鳌:“顶流”DeepSeek改变世界的看法

从钓鱼台到博鳌:“顶流”DeepSeek改变世界的看法

“那些对中国科技创新感到惊讶的人,一定是活在石头下,闭上眼睛还捂住了耳朵。”作为AI界的“顶流”,DeepSeek是年后两场高级别论坛的焦点。“DeepSeek不光在性能上接近世界最好的模型,而且成本...

DeepSeek进组《流浪地球3》,十年,“赛博工头”和沈腾一起来了

DeepSeek进组《流浪地球3》,十年,“赛博工头”和沈腾一起来了

电影《流浪地球》的官微几天前给广大网友出了道选择题:哪一项危机不是《流浪地球2》中MOSS说的。选项包括:A、2027年时间不足危机;B、2044年太空电梯危机;C、2058年月球坠落危机;D、207...

把DeepSeek当老中医?切勿当真

把DeepSeek当老中医?切勿当真

文汇报见习记者 张菲垭最近,互联网上掀起了一阵“DeepSeek问诊”热潮,不少人开始尝试向AI求一张中医药方,而DeepSeek则一瞬间化身“老中医”。足不出户,AI问诊,情况如何?不少网友测试后发...

阿里否认“10亿美元投资DeepSeek”

阿里否认“10亿美元投资DeepSeek”

2月7日,阿里方面否认了投资DeepSeek的传闻。2月7日,阿里巴巴集团副总裁颜乔在朋友圈表示:“同为中国杭州企业,我们为DeepSeek鼓掌,但是外界流传阿里投资DeepSeek的信息是假消息。”...

DeepSeek将于下周陆续开源5个代码库 每日解锁新内容

DeepSeek将于下周陆续开源5个代码库 每日解锁新内容

 DeepSeek今日宣布,接下来一周,会陆续来源5个代码库,每日都有新内容解锁,进一步分享新的进展。DeepSeek介绍,当前在线服务的模块已经经过测试、部署完备,可以投入生产环境。公司将...

聚焦DeepSeek 推动不动产登记智能化、便捷化

聚焦DeepSeek 推动不动产登记智能化、便捷化

“针对性很强,也很实用!”3月13日上午,在南阳市不动产登记服务中心,一场“DeepSeek政务实践”大讲堂活动,让全体干部职工收获满满。温斌,是行业资深专家、南阳市政务大数据中心总工程师,此次受邀为...