当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek激活“芯”机遇

4周前 (02-17)Deepseek最新资讯46

本土AI生态小伙伴正在朝着DeepSeek“集结”时,海外AI芯片商也快速行动起来。位于美国加州的AI芯片厂商 Cerebras已经接入了DeepSeek-R1 大语言模型,其CEO 在接受采访时表示,公司已经被运行R1大模型的订单压垮。

  上海证券报记者统计,除了华为昇腾、沐曦、燧原科技、海光信息等十几家本土云端AI芯片厂商宣布适配或上架DeepSeek模型服务外,中星微、云天励飞等在端侧AI也积极接入DeepSeek模型。

  在多位业内人士看来,DeepSeek的真正意义是推动降低端侧AI应用成本,打开了端侧应用的想象空间,从而开启AI普惠时代。在此逻辑下,整个智能硬件产业在AI化中,进入新一轮成长周期,云侧和端侧AI芯片商将率先受益。

  记者注意到,或许是为抢抓AI产业机遇,本土GPU(图形处理器)公司陆续开启IPO辅导。最新案例是,2月7日,GPU公司格兰菲智能科技股份有限公司(简称“格兰菲”)提交了IPO辅导备案,这也是近7个月以来第5家本土GPU芯片公司进入IPO辅导阶段。

  云侧AI芯片商积极适配DeepSeek

  DeepSeek的朋友圈已经扩大到了海外芯片商。

  位于美国加州的AI 芯片厂商 Cerebras于2月10日对媒体表示,其已经运行了DeepSeek-R1 大语言模型。Cerebras曾推出用于AI的晶圆级芯片,单芯片峰值算力达到125 PFLOPS,搭配片外内存可以实现最高1.2PB的内存容量。

  国内AI生态圈小伙伴纷纷朝其聚拢,本土GPU公司更是纷纷响应部署。在云侧AI领域,已经有华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、燧原科技、昆仑芯、芯动力等十几家GPU芯片企业,相继宣布适配或上架DeepSeek大模型服务。

  以海光信息为例,公司于2月5日宣布,其技术团队成功完成DeepSeek V3和R1模型、DeepSeek-Janus-Pro多模态大模型与海光DCU(深度计算单元)的适配,并正式上线。公司表示,因DCU采用了GPGPU通用加速计算架构,DeepSeek模型可直接在DCU上运行,技术团队的主要工作是进行精度验证和持续的性能优化。本次适配优化的DeepSeek-Janus-Pro模型具备跨模态理解与生成能力,专注于结合视觉与语言理解能力,旨在处理更复杂的跨模态任务。

  对本土AI芯片企业来说,DeepSeek既是机遇,也是挑战,完成对其模型的适配,会推动企业算力和数据中心互联能力迈上一个新台阶。

  就机遇来说,在本土主流AI芯片公司基本完成对DeepSeek蒸馏版小模型的兼容支持后,此前可运行Llama、Qwen等常见模型的平台,便可直接无修改地运行DeepSeek蒸馏版小模型。这意味着,随着DeepSeek的应用爆发,芯片厂新一轮的市场竞争将拉开帷幕,部分公司有望脱颖而出。

  而在挑战方面,DeepSeek满血版的V3和R1拥有6710亿参数,对硬件要求大幅提升且需要额外的推理框架支持,需在推理的解码部分部署320个GPU,这种“超节点”式部署对本土芯片商是全新的挑战。

  一位知名AI创业者观察到,由于新的挑战,目前仅有约一半的本土芯片商成功上线运行了满血版。

  推理AI芯片商抢抓先机

  Cerebras的CEO 安德鲁·费尔德曼在接受采访时表示,公司已经被R1的订单压垮。其表示,DeepSeek对人工智能的影响不仅在当下,更在于将刺激出更大的AI系统。随着成本的降低,市场正在变得越来越大。

  多家机构也持类似观点。花旗分析师Laura Chen的团队表示,DeepSeek的出现,推动AI技术的低成本化和边缘化,使云端和边缘处理的混合AI模型被认为是AI未来的发展方向,将重塑半导体行业格局。银河证券也在研报中称,DeepSeek推动本土AI芯片适配,助力供应链升级,端侧小模型或将遍地开花,进一步带动国产算力的需求。

  云天励飞、中星微等本土AI芯片厂商也在端侧积极适配DeepSeek大模型。

  比如,2月8日,中星微技术宣布旗下星光智能系列AI芯片、解决方案全面融合DeepSeek大模型能力,通过“XPU芯片+大模型”的双引擎驱动,在行业应用、知识管理、边缘计算等领域实现技术突破。

  早在2月5日,云天励飞宣布,春节期间,云天励飞芯片团队完成DeepEdge10“算力积木”芯片平台与DeepSeek-R1系列大模型的适配,可以交付客户使用。DeepSeek V3/R1 671B MoE等大模型也在有序适配中。适配完成后,DeepEdge10芯片平台将在端、边、云全面支持DeepSeek全系列模型。

  云天励飞在接受记者采访时表示,AI计算分为训练和推理两个环节,根据应用场景可以分为云端和边缘。AI云端训练市场是被英伟达垄断,但是在边缘推理领域,比如用于机器人、无人机、无人车的芯片,在全球领域都还没有形成垄断的格局。边缘AI推理芯片是值得本土芯片厂商关注、大力追赶和抢占的方向。

  GPU公司陆续启动IPO

  本土GPU公司(包括高性能技术和图形图像)正在陆续开启IPO辅导。最新案例是,2月7日,格兰菲智能科技股份有限公司(简称“格兰菲”)提交了IPO辅导备案,这也是近7个月第5家进入IPO辅导的GPU公司。

  官网介绍,格兰菲成立于2020年,其致力于通过提供GPU和AMOLED显示驱动解决方案,帮助客户在计算机软硬件、自动驾驶、网络游戏、智能办公等领域解决各种潜在挑战,满足客户多样化需求。

  据记者统计,自2024年8月以来,还有燧原科技、壁仞科技、摩尔线程、沐曦等本土GPU芯片公司开启了IPO辅导,拟在A股上市。燧原科技等四家公司也均宣布,完成了对DeepSeek大模型的接入和适配。

  一位半导体业内人士表示,以DeepSeek为代表的AI大模型带动GPU市场快速增长,但GPU研发投入巨大,能率先获得二级市场支持的公司,将更有望抓住产业发展机遇。

  多家A股公司也在布局GPU相关领域。比如,青云科技、弘信电子等选择了牵手燧原科技,科华数据与天数智芯签署了战略合作协议,四川长虹、中贝通信、科大讯飞等则采用华为AI芯片昇腾910B。


“DeepSeek激活“芯”机遇” 的相关文章

Deepseek的「深度思考」和「联网搜索」有什么区别,怎么使用?

Deepseek的「深度思考」和「联网搜索」有什么区别,怎么使用?

微信接入Deepseek之后,我几乎每天都在使用,抛开专业术语我用大白话讲一下“深度思考”和“联网搜索”这两者的区别。 假如你是一个小学生,Deepseek的「深度思考」就像百科全书,你可以问:...

中电万维助力兰州政务系统接入DeepSeek 打造“小兰AI答”

中电万维助力兰州政务系统接入DeepSeek 打造“小兰AI答”

2月24日,中电万维应兰州市数据局要求,将DeepSeek人工智能大模型接入兰州市政府门户网站,打造DeepSeek在兰州市的首个应用场景。万维迅速组建DeepSeek专项协同攻坚队,55小时内圆满完...

DeepSeek:像聊天一样清洗数据,复杂操作变简单

DeepSeek:像聊天一样清洗数据,复杂操作变简单

在日常工作中,你是否经常遇到这样的烦恼:表格数据杂乱无章,需要手动拆分单元格到不同行;二维交叉表难以分析,想转成一维表却无从下手;分组汇总时,想把多行合并成一行,但耗时费力……别焦虑!用DeepSee...

科蓝软件:已成功将DeepSeek-R1模型整合至公司魔聚平台

科蓝软件:已成功将DeepSeek-R1模型整合至公司魔聚平台

人民财讯3月5日电,科蓝软件(300663)3月5日在互动平台表示,公司已成功将DeepSeek-R1模型整合至公司的人工智能应用平台——魔聚平台。具体来说,魔聚平台成功部署并全面投入使用了DeepS...

清华免费发布DeepSeek入门手册遭网店打印兜售,团队回应

清华免费发布DeepSeek入门手册遭网店打印兜售,团队回应

近日,清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室团队免费发布的《DeepSeek 从入门到精通》电子文档引发了网友的广泛关注。然而,某电商平台上随后出现出售的打印版,价格超过13元/本,引发...

deepseek大家都用来做什么?

deepseek大家都用来做什么?

我是资深的AI产品经理,深度体验过国内外30+AI工具。 DeepSeek的实际应用场景比想象中更"接地气",说几个真实案例: 1. 程序员摸鱼神器 上周路过技术部,...