当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek激活“芯”机遇

8个月前 (02-17)Deepseek最新资讯374

本土AI生态小伙伴正在朝着DeepSeek“集结”时,海外AI芯片商也快速行动起来。位于美国加州的AI芯片厂商 Cerebras已经接入了DeepSeek-R1 大语言模型,其CEO 在接受采访时表示,公司已经被运行R1大模型的订单压垮。

  上海证券报记者统计,除了华为昇腾、沐曦、燧原科技、海光信息等十几家本土云端AI芯片厂商宣布适配或上架DeepSeek模型服务外,中星微、云天励飞等在端侧AI也积极接入DeepSeek模型。

  在多位业内人士看来,DeepSeek的真正意义是推动降低端侧AI应用成本,打开了端侧应用的想象空间,从而开启AI普惠时代。在此逻辑下,整个智能硬件产业在AI化中,进入新一轮成长周期,云侧和端侧AI芯片商将率先受益。

  记者注意到,或许是为抢抓AI产业机遇,本土GPU(图形处理器)公司陆续开启IPO辅导。最新案例是,2月7日,GPU公司格兰菲智能科技股份有限公司(简称“格兰菲”)提交了IPO辅导备案,这也是近7个月以来第5家本土GPU芯片公司进入IPO辅导阶段。

  云侧AI芯片商积极适配DeepSeek

  DeepSeek的朋友圈已经扩大到了海外芯片商。

  位于美国加州的AI 芯片厂商 Cerebras于2月10日对媒体表示,其已经运行了DeepSeek-R1 大语言模型。Cerebras曾推出用于AI的晶圆级芯片,单芯片峰值算力达到125 PFLOPS,搭配片外内存可以实现最高1.2PB的内存容量。

  国内AI生态圈小伙伴纷纷朝其聚拢,本土GPU公司更是纷纷响应部署。在云侧AI领域,已经有华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、燧原科技、昆仑芯、芯动力等十几家GPU芯片企业,相继宣布适配或上架DeepSeek大模型服务。

  以海光信息为例,公司于2月5日宣布,其技术团队成功完成DeepSeek V3和R1模型、DeepSeek-Janus-Pro多模态大模型与海光DCU(深度计算单元)的适配,并正式上线。公司表示,因DCU采用了GPGPU通用加速计算架构,DeepSeek模型可直接在DCU上运行,技术团队的主要工作是进行精度验证和持续的性能优化。本次适配优化的DeepSeek-Janus-Pro模型具备跨模态理解与生成能力,专注于结合视觉与语言理解能力,旨在处理更复杂的跨模态任务。

  对本土AI芯片企业来说,DeepSeek既是机遇,也是挑战,完成对其模型的适配,会推动企业算力和数据中心互联能力迈上一个新台阶。

  就机遇来说,在本土主流AI芯片公司基本完成对DeepSeek蒸馏版小模型的兼容支持后,此前可运行Llama、Qwen等常见模型的平台,便可直接无修改地运行DeepSeek蒸馏版小模型。这意味着,随着DeepSeek的应用爆发,芯片厂新一轮的市场竞争将拉开帷幕,部分公司有望脱颖而出。

  而在挑战方面,DeepSeek满血版的V3和R1拥有6710亿参数,对硬件要求大幅提升且需要额外的推理框架支持,需在推理的解码部分部署320个GPU,这种“超节点”式部署对本土芯片商是全新的挑战。

  一位知名AI创业者观察到,由于新的挑战,目前仅有约一半的本土芯片商成功上线运行了满血版。

  推理AI芯片商抢抓先机

  Cerebras的CEO 安德鲁·费尔德曼在接受采访时表示,公司已经被R1的订单压垮。其表示,DeepSeek对人工智能的影响不仅在当下,更在于将刺激出更大的AI系统。随着成本的降低,市场正在变得越来越大。

  多家机构也持类似观点。花旗分析师Laura Chen的团队表示,DeepSeek的出现,推动AI技术的低成本化和边缘化,使云端和边缘处理的混合AI模型被认为是AI未来的发展方向,将重塑半导体行业格局。银河证券也在研报中称,DeepSeek推动本土AI芯片适配,助力供应链升级,端侧小模型或将遍地开花,进一步带动国产算力的需求。

  云天励飞、中星微等本土AI芯片厂商也在端侧积极适配DeepSeek大模型。

  比如,2月8日,中星微技术宣布旗下星光智能系列AI芯片、解决方案全面融合DeepSeek大模型能力,通过“XPU芯片+大模型”的双引擎驱动,在行业应用、知识管理、边缘计算等领域实现技术突破。

  早在2月5日,云天励飞宣布,春节期间,云天励飞芯片团队完成DeepEdge10“算力积木”芯片平台与DeepSeek-R1系列大模型的适配,可以交付客户使用。DeepSeek V3/R1 671B MoE等大模型也在有序适配中。适配完成后,DeepEdge10芯片平台将在端、边、云全面支持DeepSeek全系列模型。

  云天励飞在接受记者采访时表示,AI计算分为训练和推理两个环节,根据应用场景可以分为云端和边缘。AI云端训练市场是被英伟达垄断,但是在边缘推理领域,比如用于机器人、无人机、无人车的芯片,在全球领域都还没有形成垄断的格局。边缘AI推理芯片是值得本土芯片厂商关注、大力追赶和抢占的方向。

  GPU公司陆续启动IPO

  本土GPU公司(包括高性能技术和图形图像)正在陆续开启IPO辅导。最新案例是,2月7日,格兰菲智能科技股份有限公司(简称“格兰菲”)提交了IPO辅导备案,这也是近7个月第5家进入IPO辅导的GPU公司。

  官网介绍,格兰菲成立于2020年,其致力于通过提供GPU和AMOLED显示驱动解决方案,帮助客户在计算机软硬件、自动驾驶、网络游戏、智能办公等领域解决各种潜在挑战,满足客户多样化需求。

  据记者统计,自2024年8月以来,还有燧原科技、壁仞科技、摩尔线程、沐曦等本土GPU芯片公司开启了IPO辅导,拟在A股上市。燧原科技等四家公司也均宣布,完成了对DeepSeek大模型的接入和适配。

  一位半导体业内人士表示,以DeepSeek为代表的AI大模型带动GPU市场快速增长,但GPU研发投入巨大,能率先获得二级市场支持的公司,将更有望抓住产业发展机遇。

  多家A股公司也在布局GPU相关领域。比如,青云科技、弘信电子等选择了牵手燧原科技,科华数据与天数智芯签署了战略合作协议,四川长虹、中贝通信、科大讯飞等则采用华为AI芯片昇腾910B。


“DeepSeek激活“芯”机遇” 的相关文章

对话中科闻歌王磊:DeepSeek给创业者带来的震撼与启示

对话中科闻歌王磊:DeepSeek给创业者带来的震撼与启示

未来,我们可能需要构建自己的统一计算框架,一旦能够打造好,那国内的GPU芯片生态建设必将向前迈出一大步。腊月二十八那天,中科闻歌董事长王磊跟团队开会到凌晨2点,技术嗅觉敏感的他们一直在讨论DeepSe...

南威软件发布通用DeepSeek+智能体一体机系列产品,助力AI大模型价值释放

南威软件发布通用DeepSeek+智能体一体机系列产品,助力AI大模型价值释放

重磅发布|南威软件发布通用DeepSeek+智能体一体机系列产品,助力AI大模型价值释放###  2月28日,南威软件通用DeepSeek一体机系列产品发布会,通过网络直播的方式举行,累计吸引了行业内...

科技伦理视域下DeepSeek的学术风险及其防范

科技伦理视域下DeepSeek的学术风险及其防范

作者:刘科(河南师范大学科技与社会研究所教授);贾豫政(河南师范大学科技与社会研究所助理研究员)近期,人们对DeepSeek(深度求索)的热议揭示了人机关系的复杂性,也凸显了在AI领域嵌入科技伦理的必...

外媒:从DeepSeek到《哪吒2》 中国不断突破科技创新与艺术创造极限

外媒:从DeepSeek到《哪吒2》 中国不断突破科技创新与艺术创造极限

国际在线专稿:美国《欧亚评论》网站近日刊发学者伊姆兰·哈立德署名文章《从电影票房到人工智能:中国重新定义全球叙事》。文章聚焦近期火爆出圈的两大“中国智造”——国产AI大模型DeepSeek和国产动画影...

金融行业加速部署DeepSeek 机构建议关注各类金融IT公司

金融行业加速部署DeepSeek 机构建议关注各类金融IT公司

媒体报道,全国人大代表、四川天府银行董事长黄毅接受采访时表示,人工智能大模型为银行业转型带来诸多机遇。其一,显著降低大模型应用成本。其开源策略使企业能够以较低成本使用先进大模型,减轻银行尤其是中小银行...

DeepSeek加速推开ASIC时代大门

DeepSeek加速推开ASIC时代大门

近日,DeepSeek研究团队再放大招,公开NSA算法。同日,马斯克发布Grok 3模型,试与DeepSeek和Open AI来比高。此外,Open AI首款AI ASIC芯片即将完成,有望明年量产....