当前位置:首页 > Deepseek最新资讯 > 正文内容

最新的DeepSeek更新了 有网友对新版R1模型进行了测试

5个月前 (05-29)Deepseek最新资讯528

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。

有网友对新版R1模型进行了测试,并表示Deepseek-R1-0528在竞赛级编程的难度基准LiveCodeBench中的表现几乎与OpenAI的o3模型相当。

社交网络和信息网站City-data.com创始人Lech Mazur在社交媒体上表示,Deepseek-R1-0528在Extended NYT Connections基准测试中比原先的DeepSeek R1有了显著改进,分数从38.6上升到49.8。在Thematic Generation基准测试中,Deepseek-R1-0528也优于DeepSeek R1,分数从1.80变为1.74,该分数越低越好。Thematic Generation基准测试衡量各种大模型如何有效地从一小组正例和反例中推断出一个细分或特定的“主题”(类别/规则),然后在一组具有误导性的候选项中检测出哪一项真正符合该主题。

DeepSeek今年春节期间大火。3月份,DeepSeek V3模型完成小版本升级。新版V3模型借鉴DeepSeek R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任务方面,新版V3模型基于R1的写作水平进行优化,同时提升中长篇文本创作的内容质量。


“最新的DeepSeek更新了 有网友对新版R1模型进行了测试” 的相关文章

法律人118个常用DeepSeek提示词,0基础必看!!

法律人118个常用DeepSeek提示词,0基础必看!!

一、合同管理(15个)1.智能起草:生成跨境电商平台服务协议模板,包含数据跨境传输条款和不可抗力情形说明2.条款审核:用《民法典》合同编逐条审查技术开发合同,自动标注权利义务不对等条款(重点核查知识产...

DeepSeek API 的返回值格式是什么?

DeepSeek API 的返回值格式是什么?

DeepSeek API 的返回值格式是什么?DeepSeek API的返回值格式通常是JSON格式。这种格式返回的数据包括生成的文本内容、状态码(用于判断请求是否成功)、错误信息(若请求失败时)等。...

DeepSeek引发市场跷跷板!基金经理“忙不停”

DeepSeek引发市场跷跷板!基金经理“忙不停”

“DeepSeek正在引发世界对中国AI产业、中国科技资产,甚至中国整体资产的价值重估。”在接受券商中国记者采访时,一位基金经理满怀激动地讲道。中国AI发展的主流叙事已经逐渐从追赶转向超越,这一认知的...

无人机+DeepSeek 郑州交警解锁城市交通治理新模式

无人机+DeepSeek 郑州交警解锁城市交通治理新模式

□大河报·豫视频记者 邵可强 文图当警用无人机遇上人工智能会擦出怎样的火花?在郑州街头,一场由“无人机+DeepSeek”引领的交通管理变革正在悄然上演。4月14日,大河报记者了解到,从空中侦察员、安...

普渡机器人接入DeepSeek满血版模型

普渡机器人接入DeepSeek满血版模型

 中证报中证网讯(记者 齐金钊)日前,普渡机器人宣布接入DeepSeek满血版模型,大幅提升机器人智能语音交互能力。据悉,首批部署的贝拉Pro机器人已在部分商超落地测试,后续将逐步推广至其他机型及场景...

宝马年内将为多款中国在售新车接入DeepSeek功能

宝马年内将为多款中国在售新车接入DeepSeek功能

钛媒体App 4月23日消息,宝马集团董事长齐普策在今日举行的宝马发布会上宣布,今年内宝马将为多款中国在售新车接入DeepSeek功能,通过深度思考能力赋能以BMW智能个人助理为中心的人机交互体验。未...