当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

6个月前 (03-03)Deepseek最新资讯384

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


标签: DeepSeek

“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

DeepSeek融入闽企智能化生产

DeepSeek融入闽企智能化生产

东南网2月28日讯(福建日报见习记者 汤海波) 日前,泉州汇成针织有限公司成功打造福建省首个纺织专用设备行业深度融合国产AI大模型DeepSeek的智能化生产体系。这家位于泉州洛江的制造业企业,通过将...

DeepSeek一体机有哪些功能?DeepSeek一体机配置要求价格

DeepSeek一体机有哪些功能?DeepSeek一体机配置要求价格

最近,科技圈有个“新晋顶流”横空出世,名字叫DeepSeek一体机。它火到什么程度?朋友圈不断刷屏,有人调侃:“没抢到DeepSeek一体机,都不好意思说自己懂科技。”一款设备,凭什么能火出圈?Dee...

如何评论微软禁止员工使用DeepSeek

如何评论微软禁止员工使用DeepSeek

如何评论微软禁止员工使用DeepSeek微软首次公开宣布禁止DeepSeek在本国上架,同时禁止员工使用该产品。此次表态的场合是在美国参议院,微软此举或许有向相关方面“表忠心”的意味,以较为强硬的姿态...

DeepSeek大模型技术落地江汉区 AI赋能智慧政务

DeepSeek大模型技术落地江汉区 AI赋能智慧政务

荆楚网(湖北日报网)讯(通讯员 王硕)在数字经济与实体经济深度融合的今天,人工智能正深刻重塑政务服务模式。今年以来,武汉市江汉区率先引入DeepSeek大模型技术,在重大项目监管、民生需求匹配、政策资...

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

一开始,我还以为 DeepSeek 会走传统路线,比如大厂常见的蒸馏技术,搞个小参数的 Flash 模型。毕竟这种方法能有效降低计算需求,但缺点也很明显,就是小模型再怎么优化,和大模型比起来,性能还是...

青岛市医保局实现DeepSeek本地化部署

青岛市医保局实现DeepSeek本地化部署

为响应国家“人工智能+”战略部署,青岛市医保局积极探索人工智能技术与医保管理的深度融合,使用青岛市大数据局部署的DeepSeek大模型和青岛市医保局本地部署的Deepseek大模型,成功上线“医保政策...