阿里巴巴发布Qwen3.5,声称性能超越美国顶级AI模型

阿里巴巴发布Qwen3.5,声称性能超越美国顶级AI模型

阿里巴巴发布Qwen3.5,声称性能超越美国顶级AI模型

阿里巴巴和蚂蚁集团发布了新一波开源人工智能模型,标志着中国科技公司在快速发展的AI领域加大力度与美国竞争对手展开竞争。

阿里巴巴于2月16日(农历新年前夕)发布了Qwen3.5模型,而蚂蚁集团则于2月15日宣布推出其万亿参数模型Ling-2.5-1T和Ring-2.5-1T。这些发布恰逢DeepSeek突破性进展一周年,该突破曾挑战了西方关于开发有竞争力的AI系统成本的假设。

阿里巴巴Qwen3.5聚焦效率提升

据阿里巴巴介绍,Qwen3.5拥有3970亿参数,但通过稀疏混合专家架构,每次前向传播仅激活170亿参数。该公司声称,与前代产品相比,这种方法使模型运营成本降低60%,处理大型工作负载的能力提升8倍。

该模型现在支持201种语言,高于上一代的82种,并包含阿里巴巴所描述的"视觉代理能力"——能够在移动和桌面应用程序中自主执行任务。据路透社报道,该公司在一份声明中表示:"Qwen3.5专为智能代理AI时代打造,旨在帮助开发者和企业以相同的算力实现更快速度和更多功能。"

阿里巴巴在30多项基准测试中将Qwen3.5与OpenAI的GPT-5.2、Anthropic的Claude 4.5 Opus和谷歌的Gemini 3 Pro进行了比较,声称在衡量模型遵循用户指令能力的IFBench测试中表现优于两者。这些说法的独立验证仍在进行中。

蚂蚁集团瞄准数学推理能力

据蚂蚁集团新闻稿,该公司最新的万亿参数大语言模型 Ling-2.5-1T 专为更高的推理效率而设计,支持最长达100万个token的上下文长度。在 AIME 2026 基准测试中,该模型的性能与前沿思维模型相当,但仅使用了约5,890个token,而通常需要15,000至23,000个token。

Ring-2.5-1T 被称为全球首个混合线性架构思维模型,专注于高级推理任务。该模型在学术基准测试中取得了金牌级别的成绩,包括在2025年国际数学奥林匹克竞赛中获得42分满分中的35分,达到金牌标准,以及在2025年中国数学奥林匹克竞赛中获得126分满分中的105分,超过中国国家队的入选分数线。这两个模型均在 Hugging Face 和 ModelScope 上以开放许可证提供。

中国开源战略势头强劲

这些发布反映了中国人工智能行业向开源发展的更广泛趋势。据《麻省理工科技评论》报道,在 Hugging Face 平台上,阿里巴巴的通义千问(Qwen)系列模型的总下载量已超过 Meta 的 Llama 模型。截至 2025 年 4 月,Hugging Face 上基于 Qwen 衍生的新语言模型占比超过 40%,而 Llama 的占比则降至约 15%。

《环球时报》周三发表的社论指出:"中国企业正在积极采用开源战略,大幅降低了全球开发者和企业获取先进人工智能技术的门槛。"这种竞争压力已延伸至硅谷,据安德森·霍洛维茨(Andreessen Horowitz)合伙人马丁·卡萨多(Martin Casado)称,约 80% 使用开源技术栈的初创公司正在运行中国的开源模型。