当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞

  据新浪科技报道,近日DeepSeek再次新发布并开源的OCR模型,从根本上改变了AI游戏规则。Github开源项目DeepSeek-OCR,一夜收获超4k星。相关论文(《DeepSeek OCR:上下文光学压缩》)解释了这一研究成果。

  传统OCR如同“文字扫描仪”,通过光学技术将图像中的文字提取转换为计算机和人都能理解的格式。比如,在将大量票据、证件、表单等数据电子化时,OCR发挥关键作用。

  但DeepSeek却反其道而行之——将文本信息“绘制”为视觉图像,再通过视觉模型实现高效理解。如此创新尝试就是为了解决大模型的核心痛点——处理长文本时面临的计算挑战deepseek

  10页密密麻麻的文本报告,被压缩成一张图片,AI能够一眼读懂它。这样的信息处理效率意味着大幅降低了计算复杂度,用最直接的方式节约成本。

  最近还在锐评AI发展的OpenAI创始团队成员、特斯拉前AI总监Karpathy,对DeepSeek新成果直言喜爱,并指出“早就该让视觉成为AI核心,而非依赖烂透了的文本分词器。”

  更有业内大佬感叹,“当文本能被转化为视觉可理解的结构,语言与视觉的统一或许不再是理论。这可能是通往 AGI(通用人工智能)的关键一步。

  深度学习模型的记忆以分布式参数形式存储,这种非结构化存储导致传统神经网络在学习新任务时,旧知识的参数空间会被新知识覆盖,模型无法做到像人类一样进行连贯推理。

  而DeepSeek的想法是,通过视觉-文本压缩范式和动态分层遗忘机制,让AI“记住该记住的,忘记该忘记的”。

  其核心思路是将文本信息转化为视觉token,通过光学压缩实现高效记忆管理,同时模拟人类遗忘曲线动态调整信息留存。原文出处:DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞,感谢原作者,侵权必删!

标签: deepseek
返回列表

上一篇:DeepSeek昨天开源的新模型,有点邪门。

没有最新的文章了...

“DeepSeek新模型颠覆OCR传统,文本转视觉获Karpathy盛赞” 的相关文章

10月18日DeepSeek预测:灰熊vs热火,伤病潮下谁能止颓?莫兰特缺阵考验

10月18日DeepSeek预测:灰熊vs热火,伤病潮下谁能止颓?莫兰特缺阵考验

  在10月18日的NBA季前赛收官战中,迈阿密热火将坐镇主场迎战孟菲斯灰熊。两支球队目前均遭遇五连败,且核心球员大面积伤停,这场残阵对决将成为检验板凳深度的关键战役。...

拆解一品威客平台AI引擎:如何精准匹配创意需求

拆解一品威客平台AI引擎:如何精准匹配创意需求

  在创意经济蓬勃发展的今天,每天有不少企业创意需求与服务商在数字平台中擦肩而过。云南个体户如何精准找到上海的设计师?贵州初创企业如何高效对接北京开发团队?一品威客平台的AI智能匹配引擎,...

刚刚,DeepSeek新模型自砍一刀!大降价50%,华为寒武纪已适配

刚刚,DeepSeek新模型自砍一刀!大降价50%,华为寒武纪已适配

  为了严谨地评估引入稀疏注意力带来的影响,DeepSeek特意把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集上,...

曼联 截胡 伊萨克的最佳机会

曼联 截胡 伊萨克的最佳机会

  2. 利物浦想要1.2亿买伊萨克,但是只能给20万磅的周薪,距离30万磅有一定差距,伊萨克看在英超冠军的名号下,勉强接受个人合同,达成口头协议。   3. 伊萨克是威...

[流言板]曝iPhone 17 Pro要涨价:或将突破1000美元大关

[流言板]曝iPhone 17 Pro要涨价:或将突破1000美元大关

  虎扑07月31日讯 据媒体报道,当地时间7月30日,美国总统特朗普发文称,自8月1日起,美国将对来自印度的商品征收25%的关税。   分析师称,若25%的关税生效,苹...

中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-2510

中原证券-人工智能行业专题:后R1时代,DeepSeek发展的三大阶段-2510

  DeepSeek在年初发布了R1以后,受到了各界普遍关注。后续来看,DeepSeek并没有如期发布更先进的模型R2,而是在进行更多小版本的更新换代。结合每个阶段的发展重点,我们将其划分...