当前位置:首页 > Deepseek最新资讯 > 正文内容

AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美

  IT之家 10 月 10 日消息,科技媒体 venturebeat 于 10 月 8 日发布博文,报道称三星高级 AI 研究院发布了名为微型递归模型(TRM)的开源 AI 模型,仅包含 700 万个参数,不过在数独、迷宫等特定的结构化推理任务上,表现媲美甚至超越了参数量为其 10000 倍的谷歌 Gemini 2.5 Pro 等顶尖大模型。

  该模型仅有 700 万参数,设计理念是极致简化复杂性。在架构方面,摒弃了分层推理模型(HRM)所依赖的双网络协作架构,转而采用一个仅有两层的单一模型。

  其核心机制在于“递归推理”:模型对自身输出的预测进行反复迭代和修正deepseek,每一步都纠正前一步的潜在错误,直至答案收敛稳定。

  TRM 通过这种方式,用迭代计算的深度模拟了庞大网络的复杂推理过程,实现了“以递归替代规模”的目标,从而在不牺牲性能的前提下,大幅降低了计算和内存成本。

  然而,一个重要的前提是,TRM 是专门为解决结构化、可视化的网格类问题(如数独、迷宫和特定解谜任务)而设计的,并非通用的语言聊天模型,它擅长在有明确规则的封闭环境中进行逻辑推理,而非开放式的语言生成。

  TRM 的成功源于其刻意追求的“少即是多”极简主义设计。研究发现,增加模型层数或大小反而会导致在小数据集上出现过拟合,性能下降。其精简的双层结构与递归深度相结合,实现了最佳效果。

  TRM 的代码、训练脚本和数据集目前已在 GitHub 上根据 MIT 许可证完全开源,企业和研究人员均可免费使用、修改和部署,甚至用于商业应用。原文出处:AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型,感谢原作者,侵权必删!

标签: deepseek

“AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美” 的相关文章

DeepSeek模型升级至V3.1,上下文长度达128k

DeepSeek模型升级至V3.1,上下文长度达128k

  重磅:DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至128kdeepseek,API接口调用方式保持不变。   近期DeepSeek更新聚焦实用性...

在大巴黎时,你们叫人家姆甜甜;在皇马时,你们叫人家龟夫人

在大巴黎时,你们叫人家姆甜甜;在皇马时,你们叫人家龟夫人

  姆子在皇马态度其实已经端正很多了,至少没有干出进攻端跑了一半就撂挑子不干了这种惊世骇俗的名场面,还要什么自行车。   姆子在皇马态度其实已经端正很...

AI基础设施领域唯一标杆, 北电数智“数智化算力底座”入选2025服贸会十一项北

AI基础设施领域唯一标杆, 北电数智“数智化算力底座”入选2025服贸会十一项北

  以“数智领航,服贸焕新”为主题,2025中国国际服务贸易交易会(服贸会)于9月10日-14日在北京举办。本届服贸会吸引了近2000家企业“赴约”参展,85个国家及国际组织通过设展办会深...

DeepSeek与华为模型算力共生推动中国AI系统级突围

DeepSeek与华为模型算力共生推动中国AI系统级突围

  DeepSeek与华为“模型+算力”共生关系,其实给中国产业打开了一扇“系统级突围”的大门——以前我们习惯单点突破(芯片、模型、应用各干各的),现在第一次出现了“硬件-软件-场景”在同...

DeepSeek预测:布伦特福德vs切尔西!蓝军火力全开,蜜蜂主场恐遭碾压?

DeepSeek预测:布伦特福德vs切尔西!蓝军火力全开,蜜蜂主场恐遭碾压?

  英超联赛第4轮即将迎来一场焦点战,布伦特福德将在主场迎战切尔西。目前切尔西以2胜1平的战绩排名联赛第2,而布伦特福德则以1胜2负排名第15。本场比赛对于双方来说都至关重要,尤其是布伦特...

DeepSeek布局AI全产业链,覆盖资本算力数据多领域合作

DeepSeek布局AI全产业链,覆盖资本算力数据多领域合作

  DeepSeek作为国内领先的人工智能大模型研发企业,其产业链布局广泛,涵盖资本支持、算力基础设施、数据服务及多行业场景合作等多个层面。   在资本层面,多家机构通过...