当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

17小时前Deepseek应用场景40

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

见证历史!DeepSeek跃居全球第二AI实验室,R1登顶开源王座,R2全网催更

见证历史!DeepSeek跃居全球第二AI实验室,R1登顶开源王座,R2全网催更

【新智元导读】终于等到了DeepSeek-R1-0528官宣。升级后的模型性能直逼o3和Gemini 2.5 Pro。如今,DeepSeek真正坐实了全球开源王者的称号,并成为了第二大AI实验室。昨晚...

DeepSeek R1 新版幻觉最高降低 50%

DeepSeek R1 新版幻觉最高降低 50%

DeepSeek R1 新版幻觉最高降低 50%昨日,DeepSeek R1 模型正式完成小版本升级,目前版本为「DeepSeek-R1-0528」。据介绍,DeepSeek-R1-0528 仍然使用...

独家对话IBM陈旭东:DeepSeek很热,但影响尚未全面到来!丨 科创100人

独家对话IBM陈旭东:DeepSeek很热,但影响尚未全面到来!丨 科创100人

 文 丨 新浪科技 周文猛  “DeepSeek很热,但它对企业的大影响还没全面到来。”  “许多企业拥抱AI,还要补数字化的课。”  “智能体归根结底是一个软件,规模化应用要有信息化基础”  “所有...

百度 AI 搜索宣布全面接入 DeepSeek R1 最新版,推理能力更强

百度 AI 搜索宣布全面接入 DeepSeek R1 最新版,推理能力更强

IT之家 5 月 31 日消息,5 月 28 日晚,DeepSeek R1 模型宣布完成小版本试升级,在模型架构、推理能力和开放性方面均有显著提升。随后,腾讯宣布旗下元宝、ima 等一系列 AI 应用...

引入DeepSeek大模型 青岛创新房屋市政工程评标监管新机制

引入DeepSeek大模型 青岛创新房屋市政工程评标监管新机制

信网6月26日讯 为切实提升房屋建筑和市政工程评标质效,构建公平高效的招投标市场环境。6月24日,青岛市住房和城乡建设局印发《关于房屋建筑和市政工程招投标领域试点实施人工智能辅助评标主观打分...

深耕DeepSeek领域 引领行业智能化变革

深耕DeepSeek领域 引领行业智能化变革

在“东数西算”工程与东北全面振兴战略的交汇点上,辽宁电信以DeepSeek人工智能技术为支点,构建起“智算筑基—场景突破—生态聚合”的创新发展体系,成为东北地区AI产业升级的关键推动者。生态辐射构建东...