亚马逊云科技为何上架Qwen和DeepSeek的最新模型
2025年二季度云业务营收增速17.5%,相比两年前的2023年三季度同比提升5.2个百分点。
亚马逊总裁安迪·贾西(Andy Jassy)在2025年二季度财报后的投资者电话会披露,亚马逊的生成式AI业务目前年营收增速达到三位数,价值数十亿美元,目前需求量已经超过了供应能力。
在全球地缘政治环境面临不确定因素的大背景下,引入更多领先的中国模型,对于亚马逊来说,可以尽量降低客户的供应链风险。
事实上,中国模型厂商在全球开源社区正在拥有越来越大的影响力。无论是Qwen3还是DeepSeek-V3.1,这两款模型的性能在全球均处于领先位置。它们是企业和开发者正在广泛使用的模型。
更重要的是,Qwen3和DeepSeek-V3.1在和OpenAI、Anthropic等全球领先模型性能接近的同时,还拥有一定的价格优势。
大模型调用价格通常是按照每百万Token(词元,AI推理算力的计量单位,一个Token可以是单词、标点、数字、符号等)的输入/输出价格计算。
也就是说,Qwen3和DeepSeek-V3.1的价格,在全球所有领先的模型中几乎是最低的。对于需要处理大量文本的应用场景,例如内容创作、智能客服等,选用这两款中国模型,能大幅降低运营成本。
一位中国创业公司的开发者今年8月曾表示,在他的实际测试中,Qwen3、DeepSeek-V3.1实际性能可以达到OpenAI、Anthropic旗舰模型的80%-90%,但价格只要30%-60%。
只有开发者用起来的模型,才是好模型。被消耗了多少Token,可以侧面证明一款模型是否真正被使用。
性能有优势,价格不算贵,客户也有需求,这也解释了为什么Amazon Bedrock会上架Qwen3还是DeepSeek-V3.1这两款来自中国的开源模型。
“模型大战”已经持续三年多,至今依然没有诞生能够“一统天下”的模型。现在,越来越多人预判,这场竞赛最终也不会有“一统天下”玩家。
2025年,全球科技公司的大模型迭代速度都越来越快,更新速度以“天”计算。据我们的综合调研统计,2025年1月1日-7月25日的206天内,中国、美国参与模型竞争的11家科技公司(包括阿里巴巴、字节跳动、腾讯、百度、华为、DeepSeek、月之暗面、谷歌、OpenAI、Anthropic、xAI)发布或迭代了至少29版大模型,平均每7.1天就会有一版新的大模型被发布。
现在的最强模型,3个-6个月后就可能被超越。企业如果将自己的AI战略完全押注在某一个封闭、独家的模型上,将会面临巨大的技术和商业风险。
在大模型的竞赛中,大语言模型、图像模型、语音模型、视频模型、3D/4D模型层出不穷。几乎每一个细分领域、每一个赛道,都有单项性能领先的选手。
选定了模型的专业领域,还要面对“不可能三角”——在成本、速度、性能三者之间权衡,最终找到适合自身业务的模型。
在真实的商业场景中,仅凭借单一模型很难满足所有需求。在这种复杂情况下,要像搭积木一样,把不同的模型组合起来,这种“多模型协作”的方法才能达到最佳的效果。
一位中国营销出海软件公司的软件负责人曾对我们表示,一个多语言客服应用,英文、小语种处理部分可能用Claude4效果更好,但中文处理部分用Qwen3的效果更高。当企业希望获得性价比,而且对幻觉率要求不高的时候,DeepSeek可能更合适。
一位国际ERP(企业资源管理)厂商人士曾提到,他们的业务之中使用了10余款模型,可以随时调用切换。他认为,选择丰富之后,才能根据模型的性能、成本、表现选型。这可以尽量降低试错成本,也可以动态切换成本更低的模型,避免被一家模型公司绑定。
一位中国科技公司大模型平台业务负责人今年6月的看法是,Muti-Agent应用即将在2025年底成熟。未来,企业内部的真实模型使用场景可能是,一个模型驱动一款Agent,不同模型驱动的不同Agent在一起协同工作。
安迪·贾西曾在re:Invent2023对此解释,要给开发者自主选择的权利。使用模型时,拥有多种选择至关重要,因为“永远不会出现一种工具在某个领域一统天下的情况”。
在亚马逊云科技的“Choice Matters”的大模型战略拼图中,至少为开发者提供了300多款模型。开发者既可以利用SageMaker平台精调、训练属于自己的模型,也可以用Amazon Bedrock直接使用全球主流模型。
Amazon Bedrock上架了全球14家模型厂商的200多款精选模型。它的使用门槛更低,可以通过API调用全球主流大模型。如果企业目标是快速将强大的生成式AI能力集成到自己的应用中deepseek,可以选择Amazon Bedrock。
在Amazon Bedrock上,客户可以在同一个平台,用同一个API,对来自中国、美国的主流模型进行性能、成本的A/B测试,进而选择适合自己的模型。
对亚马逊云科技来说,让自己的大模型平台保持中立、做大生态,才是最重要的。它不执着于在基础模型研发上与OpenAI、谷歌等公司一较高下,而是希望提供一个全面、开放、易于使用的模型平台,尽量囊括全球优秀模型,让客户根据自身需求自由选择。原文出处:亚马逊云科技为何上架Qwen和DeepSeek的最新模型,感谢原作者,侵权必删!