百度发布文心5.1,以6%的典型训练成本打造顶尖AI

百度发布文心5.1,以6%的典型训练成本打造顶尖AI

百度发布文心5.1,以6%的典型训练成本打造顶尖AI

百度 于周五发布了新一代基础模型文心5.1,宣称其性能接近前沿水平,而所需计算成本仅为训练同等规模模型通常所需的一小部分。此次发布标志着中国AI开发者持续发力——不依赖蛮力扩参,而是以效率为突破口,加速追赶西方竞争对手。

更小、更廉价、更具竞争力

文心5.1将总参数量压缩至前代文心5.0的约三分之一,激活参数量压缩至约二分之一——文心5.0拥有2.4万亿参数。百度将这一技术称为"多维弹性预训练",该技术于文心5.0时首次引入,可通过单次训练产出多个不同规模的模型。百度表示,实现上述成果所用的预训练成本,仅为同类行业模型的约6%。

在LMArena搜索排行榜上,该模型于5月9日获得1223分,位居全球第四、中国模型第一。在文本排行榜上,文心5.1以1476分位列全球第13,并在法律、政务、数学及企业管理类别中跻身前十。百度表示,文心5.1在智能体评测任务(包括τ³-bench和SpreadsheetBench-Verified)上超越DeepSeek-V4-Pro,在GPQA和MMLU-Pro知识基准测试上接近顶尖闭源模型,并在使用工具的情况下以99.6分位居AIME26榜单第二,仅次于Gemini 3.1 Pro。百度内部评测还显示,其创意写作能力与Gemini 3.1 Pro不相上下。

技术方法

效率提升源于一个两阶段流程。文心5.1并非从头训练,而是从文心5.0的弹性子模型矩阵中提取最优子网络,在继承前代知识的同时大幅降低计算成本。百度进一步采用"解耦全异步强化学习"对模型进行优化,并扩展智能体后训练规模,以提升推理能力、搜索检索能力及多源内容综合能力。

可用性与竞争背景

文心5.1现已通过百度千帆大模型平台及文心一言官网向企业用户和开发者开放。百度官方Facebook页面表示,更多产品发布将于下周举行的Create 2026大会上亮相。

此次发布正值效率优先的开发理念在中国AI行业持续升温之际——各家企业致力于在不依赖西方竞争对手海量算力预算的前提下,实现同等甚至更优的性能表现。文心5.1的成本优势——以极小比例的投入跻身顶尖排名——印证了业界所描述的"从纯粹的参数规模扩张,转向以效率驱动的后训练优化"这一趋势。