蚂蚁集团开源万亿参数AI模型
蚂蚁集团,这家支付宝背后的中国金融科技巨头,开源了两款新的万亿参数AI模型。该公司表示,这些模型在通向通用人工智能的竞赛中提升了效率和推理能力。
这两款模型分别是 Ling-2.5-1T 和 Ring-2.5-1T,于周日宣布推出,并根据公司新闻稿,已在 Hugging Face 和 ModelScope 平台以开源许可证提供。此次发布标志着该公司于2025年10月推出的 Ling 2.0 系列的最新演进。
效率提升与长上下文窗口
Ling-2.5-1T 是蚂蚁集团非推理模型阵容中的旗舰产品。该模型拥有 1 万亿总参数量,其中 630 亿为激活参数,支持最长达 100 万个 token 的上下文长度。
该模型的独特之处在于其 token 效率。在 AIME 2026 数学基准测试中,Ling-2.5-1T 仅使用约 5,890 个 token 就达到了前沿思维模型的性能水平,而这些模型通常需要 15,000 到 23,000 个 token。该公司将这些提升归功于混合线性注意力架构,以及在 29 万亿 token 的预训练数据上进行的精细化训练,相比上一代的 20 万亿 token 有所扩展。
思维模型达到金牌数学标准
Ring-2.5-1T 是蚂蚁集团所称的首个基于混合线性架构的开源万亿参数思维模型。该模型在数学基准测试中展现出金牌级表现,在2025年国际数学奥林匹克竞赛测试中获得42题中的35题正确——达到金牌分数线。它还在2025年中国数学奥林匹克竞赛中取得126题中的105题正确,超过中国国家队的入选分数线。
据蚂蚁集团称,在生成超过32,000个token的序列时,该模型的架构相比前代产品将内存访问减少了十倍以上,并将生成吞吐量提高了三倍以上。
扩展开源产品组合
这些发布扩展了蚂蚁集团的开放AI模型家族,该家族以百灵(BaiLing)品牌命名,目前包含三个主要系列:非推理模型Ling系列、推理模型Ring系列,以及多模态Ming系列。本月早些时候的2月11日,该公司发布了Ming-Flash-Omni-2.0,称其为业界首个在单一架构中统一语音、环境音效和音乐的模型。
蚂蚁集团于2023年凭借金融大语言模型进入AI模型竞争。该公司的AI子公司蚁鉴科技(InclusionAI)在过去一年中发布了18个模型,并达到了万亿参数规模,这是该公司迈向AGI(通用人工智能)持续努力的一部分。