当前位置：首页 > Deepseek最新资讯 > 正文内容

全面适配！京东云将DeepSeek推理场景性能提升50%

8个月前 (03-03)Deepseek最新资讯453

央广网北京3月3日消息在DeepSeek为期五天的“开源周”中，其连续开源的五大核心技术（FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统），惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配，在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化，综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优，在DeepSeek推理场景下性能提升50%。

全面适配五大技术，DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术，Flash MLA通过动态调度GPU的显存与算力资源，解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能，使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍，配合最新的投机推理技术，以极低的显存需求，在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外，针对用于DeepSeek开源的通信库DeepEP，京东云vGPU AI算力平台已全面支持EP模式下的分布式推理，显著提高推理吞吐。通过整合DeepEP作为通信后端，针对机内通信使用NVLink传输数据，机间通信使用NVSHMEM接口走RDMA网络，同时通过灵活的GPU SM数量利用控制，增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率，让大模型真正用起来

针对客户大模型的使用需求，京东云vGPU AI算力平台，为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务，让大模型真正用起来。

在推理性能方面，针对DeepSeek大模型技术特点，京东云通过推理加速与内核驱动级优化，提升单台服务器推理性能50%。

在国产芯片适配方面，京东云已完成从底层算力到大模型和业务应用的全面国产化适配，包括十余家国产化AI算力，确保自主可控。

在数据安全方面，通过机密容器AI全场景密态计算和先进的容器隔离技术，确保模型数据的机密性与完整性，为用户提供金融级安全防护。

目前，在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同，京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek，既满足本地政务业务，又让当地企业不用投入资源，即可通过政务云调用DeepSeek。

标签: DeepSeek

返回列表

上一篇：探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

下一篇：山石网科发布DeepSeek大模型应用一体机解决方案

“全面适配！京东云将DeepSeek推理场景性能提升50%” 的相关文章

全面适配！京东云将DeepSeek推理场景性能提升50%

“全面适配！京东云将DeepSeek推理场景性能提升50%” 的相关文章

DeepSeek在线使用指南：解锁高效智能体验

中国华能宣布接入DeepSeek

济宁能源集团DeepSeek大模型成功完成本地化部署

北京大学 | DeepSeek应用、提示词工程和落地场景(附PPT下载）

正式接入DeepSeek！福建这群医护人员已经开始学习……

把DeepSeek当老中医？切勿当真

温馨提示：
DeepSeek爱好者为非盈利站点，所有内容均来自网络整理，不保证内容的真实性。

Powered By Z-BlogPHP. Theme by TOYEAN.