登录
注册



2016 年首尔会议厅内,大卫·西尔弗坐在李世石对面,见证了 AlphaGo 的历史性时刻。十年后的今天,这位 DeepMind 前核心人物已离开谷歌,在伦敦开启全新征程。融资公告发布不到 24 小时,欧洲风险投资界为之震动:其新创公司 Ineffable Intelligence 在成立不到半年内,便完成了欧洲历史上规模最大的种子轮融资,融资金额高达 11 亿美元,公司估值飙升至 51 亿美元。领投方阵容豪华,包括红杉资本、光速资本、英伟达、DST Global、Index、谷歌以及英国 Sovereign AI 基金,这一组合涵盖了顶级风投、计算巨头及政府主权基金。
午方 AI 梳理发现,Ineffable Intelligence 成立于 2025 年 11 月,西尔弗于同年 1 月全职投入运营。从公司成立到完成 11 亿美元融资,耗时不足半年,其 51 亿美元的估值几乎等同于 Mistral 公司一年前 B 轮融资的水平,远超同期其他欧洲人工智能初创企业。这种在种子轮阶段即获得与中型上市公司相当估值的案例极为罕见,通常早期投资者需等待产品、收入或客户至少一项成型,但西尔弗凭借个人声誉直接跳过了这些传统验证步骤。投资者押注的并非具体产品,而是一场人工智能范式的根本性变革。
西尔弗的履历构成了此次融资的核心基石。在 DeepMind 任职的十年间,他主导了利用像素数据模拟 Atari 游戏、开发 AlphaGo 与 AlphaZero(无需人类规则即可掌握围棋、国际象棋和将棋)、以及让 AlphaProof 在国际数学奥林匹克竞赛中斩获银牌等里程碑项目。作为伦敦大学学院教授,他在过去十五年间成功将强化学习从学术边缘推向工业核心。午方 AI 注意到,全球范围内兼具学术声誉、工程实践及行业权威地位的人才屈指可数,西尔弗正是其中之一。当前主流模型如 GPT、Claude、Gemini 本质上是对人类生成内容的压缩与概率重构,而西尔弗的目标截然不同。
Ineffable Intelligence 明确提出了打造“超级学习者”的愿景,即构建一种不依赖人类数据、完全依靠自身“经验”进行学习的机器。这一理念并非营销口号,而是基于西尔弗与图灵奖得主理查德·萨顿共同撰写的《经验的时代》一文。文章指出,人类创作内容已被模型大量阅读,预训练的边际收益正在递减,未来模型发展需转向从环境中获取经验,通过实验、犯错和互动探索未知领域。红杉资本合伙人对此评价道,若成功,这将是继达尔文进化论之后解释并创造所有形式智能的科学突破。
然而,这一路径面临巨大挑战。早在 2017 年,AlphaZero 便通过自我对弈在封闭游戏中击败顶级程序,2024 年 AlphaProof 也通过自我生成证明获得奥赛银牌。但过去十年间,强化学习团队普遍遭遇瓶颈,原因在于“自我对弈”依赖封闭环境。围棋棋盘固定、胜负清晰,而现实任务如起草合同、证明数学猜想或陌生城市驾驶,其奖励信号定义与实验环境设置始终难以解决。西尔弗此次公开承认问题未解,并带着 11 亿美元资金与新团队重启探索,正是基于行业共识的转变。
午方 AI 分析认为,市场转向的背后是多重因素共振。OpenAI 的 o3 和 o4 系列模型日益依赖强化学习后期训练,DeepSeek R1 将强化学习微调开源化,使得“思考”能力不再局限于预训练。自 2025 年下半年起,关于预训练效果见顶的讨论频发,高质量人类语料库耗尽导致规模扩张收益下降。硅谷顶级风投正将资金从大语言模型转向强化学习、世界模型及智能体等“预训练后”领域。西尔弗凭借 AlphaGo、AlphaZero 及 AlphaProof 的工程经验,成为引领这一潮流的最佳人选,11 亿美元融资即是对该方向的强力背书。
这笔资金能否创造出无需人类数据即可实现通用智能的系统尚待观察。未来 12 个月的关键观察点包括:Ineffable 是否能在比数学奥赛更模糊的研究级数学问题上实现自我学习;红杉资本推动的 A 轮融资能否在一年内达到 30 亿美元以验证早期成果;DeepMind 原强化学习团队的后续动向;以及中国方面如 DeepSeek 和字节跳动 Byte Seed 项目是否会展示不依赖人类数据的成果。无论结果如何,11 亿美元的投入已将“超级学习者”推向行业前台,引发对人工智能发展路径的深层思考:为何 AI 必须先像人类一样,才能超越人类?