当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

2个月前 (07-10)Deepseek应用场景240

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

IBM高管评生成式AI:DeepSeek热度难掩实际影响有限

IBM高管评生成式AI:DeepSeek热度难掩实际影响有限

6月13日,IBM大中华区董事长陈旭东对生成式AI发展发表观点。他表示,尽管DeepSeek等模型备受关注,但其对企业流程的实际改变和效率提升有限。目前,生成式AI在文生图、翻译、写代码等领域应用较多...

DeepSeek暴露中国AI虚火!

DeepSeek暴露中国AI虚火!

2025年初凭借亮眼宣传与免费策略迅速占据市场的国产大模型“DeepSeek(深度求索)”,短短数月间用户反馈急剧转向,暴露其核心技术存在重大隐忧——数据真实性存疑、知识库严重滞后、技术可持续性不足等...

慕思股份:公司目前已接入Deepseek用于新产品研发

慕思股份:公司目前已接入Deepseek用于新产品研发

同花顺(300033)金融研究中心06月30日讯,有投资者向001323/ >慕思股份(001323)提问, 董秘您好:目前国内外各大平台和企业都在接入DeepSeek,请问我们慕思有接入吗?或...

酒泉市以DeepSeek为引擎 开启数智化创新实践

酒泉市以DeepSeek为引擎 开启数智化创新实践

酒泉市以DeepSeek为引擎 开启数智化创新实践  每日甘肃网兰州讯(新甘肃·甘肃日报记者范海瑞通讯员雷璐)今年以来,酒泉市以DeepSeek大模型为技术支点,在政务服务、公共治理、产业升...

AI钉铛智造深度融合DeepSeek:构建制造业生产智能服务生态共同体

AI钉铛智造深度融合DeepSeek:构建制造业生产智能服务生态共同体

2025 年,人工智能正以不可逆转之势重构全球产业版图,中国工业智能化进程在此浪潮中迎来关键突破。在这一历史性节点上,红壹科技于 1 月 2 日正式发布自主研发的工业大模型 “时光基 AI”,其成功兼...

OPPO ColorOS 小布助手完成 DeepSeek R1 最新版升级

OPPO ColorOS 小布助手完成 DeepSeek R1 最新版升级

IT之家 6 月 9 日消息,OPPO、一加手机操作系统官方微博 @ColorOS 今日发文宣布,OPPO 小布助手已率先升级 DeepSeek-R1 全新版本(海报显示为“最新版”),号称...