当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

快递物流行业迎来“DeepSeek时刻”,以AI重构“速度-成本”最优解

快递物流行业迎来“DeepSeek时刻”,以AI重构“速度-成本”最优解

曾几何时,AI领域信奉“大力出奇迹”,随着DeepSeek横空出世,以“四两拨千斤”的创新路径,仅以数百万美元的训练成本就实现了Chat-GPT4的同等性能,同时参数量也仅为对手的几十分之一。这就是D...

关于DeepSeek V3/R1 Decoding吞吐极限的估计

关于DeepSeek V3/R1 Decoding吞吐极限的估计

经历了一周DeepSeek的打脸活动后,周六 DeepSeek终于开大放出来了自身的推理系统水平,DeepSeek:DeepSeek-V3 / R1 推理系统概览 。在这个结论放出来之前,没...

deepseek怎样做数学题,deepseek如何解数学题?

deepseek怎样做数学题,deepseek如何解数学题?

DeepSeek可以通过其强大的自然语言处理(NLP)和机器学习能力来帮助解答数学题。以下是DeepSeek解答数学题的一般步骤:一、输入题目或数学问题用户可以通过DeepSeek的网页端或APP端,...

湘江新区多领域拥抱DeepSeek,“解锁”发展新路径

湘江新区多领域拥抱DeepSeek,“解锁”发展新路径

红网时刻新闻记者 王娟娟 长沙报道随着DeepSeek的爆火,一场围绕人工智能大模型的产业变革正悄然兴起。在新技术浪潮来袭之际,湘江新区拥抱DeepSeek的热情高涨。当政务遇上DeepSeek,将带...

促更多AI场景应用开发 高职院校首个DeepSeek+Hi Agent开发实战在深信院开课

促更多AI场景应用开发 高职院校首个DeepSeek+Hi Agent开发实战在深信院开课

深圳新闻网2025年3月10日讯(深圳商报首席记者 吴吉)最近,DeepSeek爆火,为我们打开了一扇全新的认知大门。如何将DeepSeek融入专业课程学习,成为学院人才培养的新抓手?最近,深圳信息职...

让AI懂湖北知产业助创新 湖北率先完成DeepSeek区域性科技情报领域模型部署

让AI懂湖北知产业助创新 湖北率先完成DeepSeek区域性科技情报领域模型部署

湖北日报讯(记者文俊、通讯员门玉英、丁迪、实习生朱诗果)3月11日,DeepSeek在湖北省科技信息研究院正式上线运行。记者获悉,在省科技厅指导下,该院在全国范围内率先完成基于DeepSeek的区域性...