谷歌推出 Gemini 3.1 Pro,声称在 AI 基准测试中取得最高分

谷歌推出 Gemini 3.1 Pro,声称在 AI 基准测试中取得最高分

谷歌推出 Gemini 3.1 Pro,声称在 AI 基准测试中取得最高分

Alphabet 于 2 月 19 日推出了 Gemini 3.1 Pro,这一升级的 AI 模型已在其消费者、开发者和企业产品中全面上线。同一天,该公司宣布与 Sea Limited 合作,为东南亚主导电商平台 Shopee 开发 AI 驱动的购物工具。这两项公告都是在新德里举行的 AI Impact 峰会期间发布的,谷歌在会上公布了一系列全球 AI 计划。

推理能力的飞跃

Gemini 3.1 Pro 在预览版发布中,在 ARC-AGI-2 基准测试中取得了 77.1% 的得分——是三个月前 Gemini 3 Pro 所达到的 31.1% 的两倍多。据这家独立基准测试公司称,该模型在 Artificial Analysis Intelligence Index 中也领先 Anthropic 的 Claude Opus 4.6 四个百分点,而运行成本还不到其一半。谷歌首席执行官桑达尔·皮查伊在 X 上转发了 Artificial Analysis 的调查结果,放大了这些成果的影响力。

该模型通过 Google AI Studio、Antigravity 和 Android Studio 中的 Gemini API 向开发者开放,通过 Vertex AI 和 Gemini Enterprise 向企业客户开放。消费者可以通过 Gemini 应用和 NotebookLM 访问,Google AI Pro 和 Ultra 订阅用户享有更高的使用限额。谷歌将此次发布描述为预览版,并指出计划"在不久后正式发布之前,继续在雄心勃勃的智能体工作流等领域取得进一步进展"。

Artificial Analysis 发现该模型在其 Intelligence Index 的十项评估中有六项领先,在推理、编码和减少幻觉方面取得了最大进步——该模型错误猜测的倾向下降了 38 个百分点。

Google 与 Shopee 合作开发智能代理购物

在另一项公告中,Google 和 Sea Limited 表示,双方将为 Sea 旗下的电商平台 Shopee 共同打造一个"AI 智能代理购物原型"。根据咨询公司 Momentum Works 的数据,Shopee 在 2024 年占据了东南亚电商市场 52% 的份额。该合作伙伴关系延伸至 Sea 的整个生态系统,包括游戏平台 Garena 和金融服务部门 Monee。

Sea 董事长兼首席执行官 Forrest Li 在公告中表示:"AI 是下一场重大技术革命,我们相信它具有巨大潜力,能够积极改变我们的业务并在我们的市场中创造价值。"两家公司还将在该地区就 Google 的开源 Agent Payments Protocol(代理支付协议)展开合作,用于支持 AI 驱动的支付流程。

这项协议使 Shopee 能够在该地区更积极地与阿里巴巴 支持的 Lazada 和 TikTok Shop 展开竞争,而在这一地区,内容驱动型和 AI 辅助型电商正在重塑竞争格局。据 Forbes 报道,该合作伙伴关系建立在 Shopee 与 YouTube 在 2024 年达成的合作基础之上,后者将该地区的创作者与卖家连接起来。

市场反应

在公告发布后,Alphabet股价出现上涨,从本周早些时候跌破300美元的低点反弹至周五上午约315美元的交易价位,不过投资者情绪仍因公司预计高达1850亿美元的资本支出而保持谨慎。Sea的股价也因这一消息而上涨。