DeepSeek或开发AI智能体模型,预计四季度发布
日前有消息源透露,DeepSeek方面正在开发一款具备更先进AI智能体(Agent )功能的大模型,意在与OpenAI等竞争对手在技术新前沿展开竞争。据称,DeepSeek正在开发的这一模型可根据用户给出的简单指令,自动完成多步骤任务,并具备从以往操作中学习、自我改进的能力。
相关消息源还表示,该项目是由DeepSeek创始人梁文峰亲自带队,目标是今年最后一个季度正式发布相关新产品。
值得一提的是,今年8月DeepSeek方面正式发布DeepSeek-V3.1模型,号称该模型通过Post-Training优化,在工具使用与智能体任务中的表现有较大提升,并称这是“迈向Agent时代的第一步”deepseek。
据DeepSeek方面公布相关信息显示,在编程智能体层面,在代码修复测评SWE和命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高。而在搜索智能体测评中,相较DeepSeek-R1-0528,DeepSeek-V3.1也展现出了全面的性能提升。
除了更强的智能体能力外,DeepSeek-V3.1还采用了混合推理架构,即一个模型同时支持思考模式与非思考模式,以及更高的思考效率。
不过需要注意的是,虽然外界期盼DeepSeek R2已有一段时间,并且在ChatGPT-5发布之后预期更盛,但截至目前DeepSeek方面尚未披露DeepSeek R2相关信息。原文出处:DeepSeek或开发AI智能体模型,预计四季度发布,感谢原作者,侵权必删!