当前位置:首页 > DeepSeek技术交流 > 正文内容

文心大模型X1对上最新版DeepSeek V3,表现谁更好?

2个月前 (03-27)DeepSeek技术交流175

3月26日,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。


“文心大模型X1对上最新版DeepSeek V3,表现谁更好?” 的相关文章

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布!

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布!

编辑:Aeneas 犀牛【新智元导读】DeepSeek新论文来了!在清华研究者共同发布的研究中,他们发现了奖励模型推理时Scaling的全新方法。DeepSeek R2,果然近了。最近,DeepSee...

接入DeepSeek,大连12345迈入“智慧服务”新时代

接入DeepSeek,大连12345迈入“智慧服务”新时代

近日,市数据局与中国移动大连分公司合作,在全省率先将DeepSeek大模型引入12345热线平台应用场景,12345热线平台成功升级智能助手、智能知识库、智能质检三大智能化应用场景,实现服务质效全面提...

DeepSeek新版本又“偷偷”变强了!苹果CEO库克此前回应:好极了

DeepSeek新版本又“偷偷”变强了!苹果CEO库克此前回应:好极了

3月24日深夜,中国人工智能初创公司深度求索(DeepSeek)低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著...

一夜爆火的DeepSeek一体机,如何改写AI游戏规则?

一夜爆火的DeepSeek一体机,如何改写AI游戏规则?

过去一个多月,科技圈有个“新晋顶流”C位出道,名字叫DeepSeek一体机。它火到什么程度?朋友圈不断刷屏,有人调侃:“没抢到DeepSeek一体机,都不好意思说自己懂AI。”所谓一体机,通常汇集了中...

全面部署DeepSeek!江苏首个区域卫生领域AI智慧服务“宁宁”上线

全面部署DeepSeek!江苏首个区域卫生领域AI智慧服务“宁宁”上线

3月5日,基于DeepSeek的江苏首个区域卫生领域AI智慧服务“宁宁”将正式上线!市民可通过“南京卫生12320”微信公众号获得24小时全天候、精准、快速的咨询服务,实现健康科普、政策咨询、机构查询...

文心一言:请详细介绍Deepseek在汽车行业应用有哪些?

文心一言:请详细介绍Deepseek在汽车行业应用有哪些?

文心一言:请详细介绍Deepseek在汽车行业应用有哪些?DeepSeek在汽车行业的应用主要体现在以下几个方面:一、自动驾驶技术的优化虽然DeepSeek目前尚未直接涉足汽车智能驾驶领域(主要因为该...