DeepSeek 的 V4 AI 模型似乎即将发布,引发对纳斯达克再次抛售的担忧

中国 AI 初创公司 DeepSeek 似乎即将发布其下一代 V4 模型,CNBC 在 2 月 23 日报道称,此次发布可能会给纳斯达克股票带来一段艰难时期。该模型原计划在 2 月中旬农历新年前后发布,虽然已错过最初的时间窗口,但多位行业观察者普遍认为其发布已迫在眉睫。周末期间泄露的基准测试数据以及"V4 Lite"变体的非官方演示加剧了华尔街的期待——以及焦虑。

DeepSeek首次震荡一年后

这种担忧源于不久前的记忆。当DeepSeek于2025年1月20日发布其R1推理模型时,后果立竿见影:据路透社报道,英伟达在单个交易日内市值蒸发约5930亿美元——这是华尔街历史上任何一家公司单日损失最大的一次——而纳斯达克指数下跌超过3%。博通暴跌17.4%,费城半导体指数下跌9.2%,创下自2020年3月以来的最差单日表现。投资者现在正在为可能的重演做准备。

DeepSeek V4建立在该公司近期研究论文中公开记录的创新之上,包括一种名为Engram的内存架构和一种称为流形约束超连接(mHC)的训练技术,这些技术最初在DeepSeek创始人梁文锋共同撰写的论文中详细阐述。据报道,这些进步使该模型能够处理超过一百万个token的上下文窗口——相比V3的128,000个token限制实现了重大飞跃——同时保持了该公司一贯的成本效益优势。据报道,DeepSeek训练其V3模型的GPU租赁成本为557.6万美元,仅为美国竞争对手数亿美元支出的一小部分,尽管SemiAnalysis的分析师认为实际的全部成本要高得多。

与美国竞争对手的紧张关系升级

V4的发布正值DeepSeek与其美国竞争对手之间的摩擦不断升级之际。2月22日,Anthropic指控DeepSeek以及中国实验室月之暗面(Moonshot)和MiniMax使用约24,000个虚假账户和超过1,600万次交互来"蒸馏"其Claude模型的能力——这一指控最初由《华尔街日报》报道。OpenAI在前一周致美国立法者的信中也提出了类似指控。这些指控为本已充满商业竞争色彩的对抗注入了地缘政治维度。

据《The Information》报道,内部基准测试显示V4在编程任务方面的表现优于OpenAI的GPT系列和Anthropic的Claude,该媒体在1月首次报道了DeepSeek的发布计划。如果该模型按照DeepSeek此前的惯例以开源形式发布,它将为开发者提供一个高性能替代方案,分析师估计其推理成本可能比同类西方模型低10到40倍。对于仍在消化微软、Alphabet、亚马逊和Meta等公司承诺投入数千亿美元AI基础设施支出的投资者来说,这种成本差距仍然是不安的核心来源。