当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek新版本又“偷偷”变强了!苹果CEO库克此前回应:好极了

2个月前 (03-26)DeepSeek技术交流178

3月24日深夜,中国人工智能初创公司深度求索(DeepSeek)低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,甚至代码能力追平美国Anthropic公司大模型Claude 3.7。

目前已在Hugging Face上开源,并迅速登上了Trending榜单。

编程能力显著提升

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,该版本的最新模型也已经同步至官网、App 和小程序,关闭“深度思考”就可体验。

没有官方新闻稿,没有技术报告,甚至在Hugging Face上传的最初文件中,连README文档都是空的,看上去,这只是V3模型的一次版本升级。

不过由于DeepSeek自带的极高话题性,这次版本升级还是引发了大量讨论和测评,并且果然没有令人失望——很多专业人士都指出,V3-0324模型在编程能力上有了显著提升。

新版本DeepSeek-V3-0324生成前端代码的能力大大提升,不少用户开始尝试将新模型与此前发布的模型结合解锁新的玩法。

此前,初代DeepSeek-V3发布于2024年12月26日晚间,这款模型自上线后便以高性价比火速“出圈”。根据官方技术论文披露,DeepSeek-V3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。深度求索表示,“这是一个全新的开始。”其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

不过,外界对于DeepSeek-V3-0324的关注并不仅仅因为该版本的能力提升,而是猜测它的发布是否意味着DeepSeek更新一代的V4与R2大模型的发布不远了。

路透社今年2月底引述3名知情人士的说法宣称,DeepSeek原计划在今年5月初发布R2,但现在希望尽早推出,具体时间尚未透露。此外,DeepSeek希望新模型在代码生成和多语言推理方面的表现进一步提升。不过,外媒的相关传言并没有得到DeepSeek公司的证实与回应。

苹果CEO库克称赞DeepSeek

3月23日,苹果公司首席执行官库克现身中国发展高层论坛2025年年会,被问及“是否用过DeepSeek”时,库克表示,“当然,感觉好极了”。

1月31日,苹果公司发布了2025财年第一季度业绩。在财报电话会议上,有分析师提到了眼下最热的中国企业深度求索的大模型DeepSeek。

库克认为,DeepSeek的人工智能模型代表了“推动效率的创新”。“总的来说,我认为推动效率的创新是一件好事。”

在回答一位分析师关于DeepSeek的人工智能模型将如何影响苹果利润率的问题时,库克说:“你知道,这就是你在模型中看到的。”

库克接着指出,苹果的人工智能采用了一种混合模式,在本地运行一些简单的任务——在其设备的定制硅芯片上使用自己的人工智能模型。

与此同时,其他更复杂的任务通过与人工智能模型提供商的合作在云中运行。不过库克表示,对于这类人工智能的支出一直采取“审慎和深思熟虑”的态度。

资料来源:环球时报、中国新闻网、九派新闻、观察者网、澎湃新闻等

(大众新闻编辑 蔡可心 整合 策划 单青)


“DeepSeek新版本又“偷偷”变强了!苹果CEO库克此前回应:好极了” 的相关文章

DeepSeek出现在杭州并非巧合

DeepSeek出现在杭州并非巧合

法国《回声报》4月10日文章,原题:杭州,挑战硅谷的中国龙 杭州,位于中国沿海富裕的浙江省,距离上海仅需几十分钟高铁车程。杭州汇金国际大厦外表低调,大堂看上去就像是酒店,越来越多的人对这里十分好奇,因...

杭州市妇联发布《DeepSeek+妇女工作操作指南》,让AI成为提升服务本领的“暖心智囊”!

杭州市妇联发布《DeepSeek+妇女工作操作指南》,让AI成为提升服务本领的“暖心智囊”!

人工智能时代,如何以积极主动的姿态正视AI、安全高效用好AI,形成与人工智能发展相匹配的素质能力,是摆在各行业干部面前的一道必答题。为充分发挥“家门口”的数字经济优势,深度运用DeepSeek等AI工...

学位一分钟“秒光”,广州老年大学首个DeepSeek班爆满

学位一分钟“秒光”,广州老年大学首个DeepSeek班爆满

DeepSeek到底有多火?连老人家都超爱!老年大学首个DeepSeek班学位一分钟被抢光!不久前广州市老年干部大学(广州老年大学)开设了全国首个老年大学DeepSeek班“同学”们超级热情学位一分钟...

多地政务服务便民热线相继宣布接入Deepseek 带来哪些变化?

多地政务服务便民热线相继宣布接入Deepseek 带来哪些变化?

央广网北京2月24日消息(总台记者任梦岩 晁向荣 黄东旭)据中央广播电视总台中国之声《新闻纵横》报道,大模型DeepSeek的火热扩展到了人们生活的方方面面,近日辽宁省级12345热线、广东省江门市1...

让deepseek写文章的技巧?如何使用deepseek写作?deepseek可以做海报吗?

让deepseek写文章的技巧?如何使用deepseek写作?deepseek可以做海报吗?

一、让DeepSeek写文章的技巧精准角色设定复制代码“请扮演《经济学人》专栏作家,分析全球碳中和政策对制造业的影响,要求:学术严谨但避免术语堆砌,引用至少2个2025年最新案例。”结构化框架引导复制...

算力机会再度来袭?DeepSeek R2未发先火,云计算50ETF(516630)或迎布局窗口期

算力机会再度来袭?DeepSeek R2未发先火,云计算50ETF(516630)或迎布局窗口期

5月12日,A股整体震荡向上,主要宽基指数涨多跌少,国防军工板块领涨两市。近日热度较高的云计算50ETF(516630)午后小幅上涨,持仓股中,石基信息、奇安信、千方科技、新易盛、电科数字、中国长城、...