当前位置:首页 > Deepseek应用场景 > 正文内容

1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版

3个月前 (06-13)Deepseek应用场景424

机器之心报道

机器之心编辑部

开源社区的人应该对 vLLM 不陌生,它是一个由加州大学伯克利分校团队开发的高性能、开源 LLM 推理和服务引擎,核心目标是提升 LLM 的推理速度(吞吐量)和资源利用率(尤其是内存),同时兼容 Hugging Face 等流行模型库。

简单来说,vLLM 能让 GPT、Mistral、LLaMA 等主流模型系列跑得更快、消耗更少资源,取得这些效果的关键是其创新的注意力机制实现方案 ——PagedAttention。

近日,DeepSeek AI 研究者、深度学习系统工程师俞星凯从零开始构建了一个轻量级 vLLM 实现 ——Nano-vLLM,将代码简化到了 1200 行。

目前,该项目在 GitHub 上收获了 200 多的 Star。

GitHub 地址:https://github.com/GeeeekExplorer/nano-vllm/tree/main

具体来讲,Nano-vLLM 具有以下三个核心功能:

一是,Fase 离线推理。推理速度与 vLLM 相当。

二是,易读代码库。实现非常简洁,Python 代码减少到了 1200 行以下。

三是,优化套件。提供 Prefix 缓存、Torch 编译、CUDA 计算图等功能。

俞星凯在基准测试中采用了以下测试配置:

硬件:RTX 4070

模型:Qwen3-0.6B

总请求:256 个序列

输入长度:100–1024 tokens 之间随机采样

输出长度:100–1024 tokens 之间随机采样

基准测试结果如下表所示,Nano-vLLM 与 vLLM 的输出 token 相同,时间略长,推理速度(吞吐量)稍逊一点点。整体而言,二者表现相当。

作者简介

Nano-vLLM 开发者俞星凯目前就职于 DeepSeek,参与过 DeepSeek-V3 和 DeepSeek-R1 的开发工作。

有意思的是,根据其 GitHub 主页,他还曾开发过一个植物大战僵尸 Qt 版,该项目也已经收获了 270 多星。此外,由于毕业于南京大学,他还曾参与了不少南京大学的计算机项目,包括南京大学计算机图形学绘图系统、南京大学分布式系统 Raft 算法最简实现、南京大学操作系统 OSLab 等。

而根据其 LinkedIn 页面可知,他曾先后在腾讯、幻方(DeepSeek 母公司)和字节跳动实习过。2023 年后入职 DeepSeek 成为深度学习系统工程师。

你是 vLLM 用户吗?会考虑尝试 Nano-vLLM 吗?


“1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版” 的相关文章

精选20个常用DeepSeek内容创作类的提示词!

精选20个常用DeepSeek内容创作类的提示词!

今天为大家整理了20个用DeepSeek做内容创作的提示词。本篇提示词并不限于DeepSeek,慧言AI平台的其他AI工具一样适用,如:gpt系列、Claude系列、Gemini系列、豆包系列等。注:...

Word如何接入DeepSeek?手把手教你AI自动化办公

Word如何接入DeepSeek?手把手教你AI自动化办公

DeepSeek与Word的梦幻联动,将为你开启高效办公的新篇章!熟悉的Word界面中,只需轻点鼠标,就能召唤出强大的DeepSeek,让它为你快速检索信息、精准翻译文本、智能生成内容…… 告别在不同...

浙江大学推出DeepSeek系列专题线上公开课

浙江大学推出DeepSeek系列专题线上公开课

近日,DeepSeek风靡全球,其对算法、模型和系统等进行的系统级协同创新,为迈向通用人工智能(AGI)的技术突破带来无限遐想。为系统解析DeepSeek在技术、应用与伦理交织演进下的革新性探索,加深...

立昂技术:立昂领算云平台已上架最新版DeepSeek-R1 660B推理模型

立昂技术:立昂领算云平台已上架最新版DeepSeek-R1 660B推理模型

  同花顺(300033)金融研究中心04月29日讯,有投资者向立昂技术(300603)提问, 董秘您好,公司跟deepseek有合作吗?请给投资者介绍下,谢谢!  公司回答表示,尊敬的投资者,您好,...

市延安医院成功接入DeepSeek

市延安医院成功接入DeepSeek

本报讯 记者徐婕报道 近日,昆明市延安医院正式上线本地化部署的DeepSeek大模型,标志着医院正式开启“AI+医疗”深度融合的智能医疗新篇章。  DeepSeek大模型依托前沿自然语言处理技术,可高...

百度AI搜索——不限量稳定使用DeepSeek-R1满血联网版

百度AI搜索——不限量稳定使用DeepSeek-R1满血联网版

百度AI搜索——不限量稳定使用DeepSeek-R1满血联网版AI搜索已接入满血联网版Deepseek-R1,一键开启深度思考,即可免费使用最新版Deepseek-R1完成各类推理任务。...