当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

13小时前Deepseek应用场景37

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

知乎直答接入DeepSeek R1最新版

知乎直答接入DeepSeek R1最新版

36氪获悉,5月30日,知乎宣布旗下AI搜索产品知乎直答正式接入DeepSeek R1-0528版本。5月28日晚,DeepSeek开启新版本测试。据介绍,DeepSeek R1-0528模型升级后,...

中国AI企业崛起挑战美国主导地位,DeepSeek模型全球部署

中国AI企业崛起挑战美国主导地位,DeepSeek模型全球部署

随着中国人工智能企业快速崛起、拓展全球市场,美国在AI领域的主导地位正受到实质性挑战。多家跨国银行与高校开始采用中国初创企业DeepSeek和阿里巴巴等开发的大语言模型作为美国产品的低价替代方案。包括...

OPPO ColorOS 小布助手完成 DeepSeek R1 最新版升级

OPPO ColorOS 小布助手完成 DeepSeek R1 最新版升级

IT之家 6 月 9 日消息,OPPO、一加手机操作系统官方微博 @ColorOS 今日发文宣布,OPPO 小布助手已率先升级 DeepSeek-R1 全新版本(海报显示为“最新版”),号称...

财哥布局信创ETF,看好DeepSeekR2引领AI科技时代

财哥布局信创ETF,看好DeepSeekR2引领AI科技时代

最近市场一直反复震荡,猫一天狗一天,主要大盘一直在蓄势,直接突破也很难,所以财哥也在翻来翻去在市场里找机会,看来看去,白酒属于大消费,消费行业改变预期还需要些时间,新能源现在要精选个股。军工煤炭ETF...

第十一届上交会推出 “上交会智慧体”,全面接入 deepseek,将于6月11日至13日举办

第十一届上交会推出 “上交会智慧体”,全面接入 deepseek,将于6月11日至13日举办

推出全面接入deepseek的“上交会智慧体”、首次设立消费与商业科技展区、3场主题日活动和近60场配套活动……6月5日上午,市政府新闻办举行新闻发布会,介绍第十一届中国(上海)国际技术进出口交易会的...

吉视传媒接入DeepSeek大模型的本地化部署

吉视传媒接入DeepSeek大模型的本地化部署

吉视传媒接入DeepSeek大模型的本地化部署报告材料一、引言2025年2月16日,吉视传媒股份有限公司宣布成功完成DeepSeek大模型的本地化部署,成为吉林省首家实现这一突破的国有企业。此次部署标...