当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek又得了个第一

8个月前 (02-15)Deepseek最新资讯435

智东西2月14日报道,刚刚,DeepSeek在开源社区Hugging Face上的点赞数跃居第一,获约8730次点赞,这一数字仍在持续上涨。



这是继DeepSeek应用力压ChatGPT登顶美区App Store免费榜、模型在开源社区GitHub上Star数首次超越OpenAI之后,DeepSeek创下的又一个历史时刻,在海外平台再次登顶。


Hugging Face点赞榜单前十名的模型中,都曾在不同节点引爆整个大模型产业。


排名第二的是曾以AI生图“新王”名号横空出世的FLUX.1,由StableDiffusion原班人马成立的黑森林工作室打造,点赞数约8710次。


排名第六的是全球1000名科学家组成BigScience打造的参数高达1760亿个的超大NLP模型BLOOM,第八的是欧洲AI独角兽Mistral AI基于MoE架构的模型Mixtral-8x7B,其余六席被Meta的Llama系列模型和StabilityAI家的模型包揽。


OpenAI的语音转录模型Whisper-large-v3被挤出前十名之列,排名第11,点赞数约3810次。


此外,DeepSeek-V3的排名在第19名,点赞约3810次,超越了微软的Phi-2和谷歌Gemma-7B模型。


Hugging Face点赞数排行榜前30的还有DeepSeek另一款开源的多模态模型Janus-Pro-7B,该模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。



▲开源社区Hugging Face点赞榜(图源:Hugging Face)


DeepSeek V3、DeepSeek R1、Janus-Pro-7B分别于2024年12月26日和今年1月20日、1月28日发布。


DeepSeek V3为DeepSeek自研MoE模型,参数量达到671B,激活参数量37B,在14.8T token上进行了预训练,该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。


DeepSeek R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。


多模态模型Janus-Pro是去年发布的Janus的高级版本,可显著提高多模态理解和视觉生成。


当下,全球已经掀起了从芯片企业、云计算巨头到各路基础设施公司适配、接入DeepSeek的热潮,DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。


“DeepSeek又得了个第一” 的相关文章

DeepSeek超越“开放权重”AI,计划发布源代码

DeepSeek超越“开放权重”AI,计划发布源代码

上个月,DeepSeek 通过发布一个新的、具有竞争力的模拟推理模型,在 AI 领域掀起了轩然大波。该模型可以在 MIT 许可证下免费下载和使用。现在,该公司正准备让这个模型背后的底层代码更加透明,承...

梅安森全线软件产品接入DeepSeek

梅安森全线软件产品接入DeepSeek

证券时报网讯,2月17日,据梅安森官微消息,梅安森全线软件产品接入DeepSeek,进一步提升公司产品智能化水平。公司目前已完成DeepSeek-R1本地化部署,并将DeepSeek与公司自研SPG矿...

中原证券:DeepSeek有望推动国产AI算力芯片加速发展

中原证券:DeepSeek有望推动国产AI算力芯片加速发展

AI算力芯片是“AI时代的引擎”。ChatGPT热潮引发全球科技企业加速布局AI大模型,谷歌、Meta、百度、阿里巴巴、华为、DeepSeek等随后相继推出大模型产品,并持续迭代升级;北美四大云厂商受...

匆忙接入DeepSeek,你想好怎么收费了么?

匆忙接入DeepSeek,你想好怎么收费了么?

自从ChatGPT在全球范围引爆关注,国内外大模型接连登场,AI技术迅速从研究室走向产业一线。无论是OpenAI的GPT-4,还是国内如DeepSeek、通义千问、文心一言等产品,AI正以前所未有的速...

关于DeepSeek的常见误区与真相

关于DeepSeek的常见误区与真相

最近,DeepSeek火得有点不讲道理。从我的朋友圈到国外媒体,从华尔街到硅谷,几乎所有人都在热议这个中国AI新秀。560万美元训练成本、开源大模型、链式推理能力、股市动荡...故事真是越讲越玄乎,热...

接入DeepSeek,跨境外贸就能躺赢?|钛媒体

接入DeepSeek,跨境外贸就能躺赢?|钛媒体

“身边的跨境老板几乎都在关注大模型动态,想着怎样用大模型提效工作流和运营能力。”孙杨是一家中小型跨境商家的老板,他对钛媒体出海参考说道。DeepSeek爆火后,以孙杨为代表的跨境老板尝试了各种Deep...