当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本

15小时前Deepseek最新资讯19

  据介绍,DeepSeek-OCR 参数量约3B ,是对“光学二维映射压缩”技术在长文本上下文处理中的可行性的一次初步探索deepseek

  模型核心由 DeepEncoder 与 DeepSeek3B-MoE-A570M 解码器构成:DeepEncoder 负责在高分辨率输入下保持低激活状态,实现高压缩比并生成适量视觉token,解码器则负责将这些 token 转化为精确文本信息。原文出处:DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本” 的相关文章

DeepSeek -V3.1让国产算力迎新机遇

DeepSeek -V3.1让国产算力迎新机遇

  DeepSeek方面称,本次升级包含以下主要变化:混合推理架构让一个模型同时支持思考模式与非思考模式;相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更...

豆包月活超越DeepSeek

豆包月活超越DeepSeek

  QuestMobile最新发布的2025年8月数据显示,豆包月活跃用户规模超越DeepSeek,登顶中国原生AI App月活榜首deepseek。原文出处:豆包月活超越DeepSeek...

DeepSeek,正在遭遇“中年危机”

DeepSeek,正在遭遇“中年危机”

  最近有媒体报道,DeepSeek R2因为芯片问题被迫推迟,此时距离R1版本的发布,已经过去了7个月时间,而R2版本原计划在5月就应该推出。   相较于发布时的风光无...

2.1亿!DeepSeek大单来了:300P算力、120台昇腾910C服务器

2.1亿!DeepSeek大单来了:300P算力、120台昇腾910C服务器

  智东西9月12日消息,9月9日,鄂尔多斯市点砾智算科技有限公司提交的鄂尔多斯市点砾智算中心建设项目准予备案。该项目总投资   项目公司拟建设300P的AI算力中心,包...

国内外AI大厂重押,初创梭哈,谁能凭记忆成为下一个DeepSeek?

国内外AI大厂重押,初创梭哈,谁能凭记忆成为下一个DeepSeek?

  如果时间往前推半年或四五个月,业界对于这一问题可能都是疑惑、不解:彼时 DeepSeek 将大模型推理能力推至高潮引起的余波仍在蔓延,Manus 在全球范围内开启通用 AI Agent...

DeepSeek官宣!新模型、新突破、新价格

DeepSeek官宣!新模型、新突破、新价格

  。据介绍,这款大模型为混合推理架构,同时支持思考模式与非思考模式。思考效率更高,相比DeepSeek-R1-0528能在更短时间给出答案。此外,新模型在工具使用与智能体任务中的表现有较...