登录
注册
过去两年,AI 行业的核心叙事几乎完全被模型能力的强弱所主导。
然而,当大模型逐渐演变为所有产品与工作流的底层通用能力后,竞争焦点正在发生根本性转移。越来越多的企业意识到,真正的挑战不在于让模型回答得更好,而在于如何让它在真实环境中稳定、可信且持续地完成任务。这种从“会回答”到“能执行”的跨越,正是 Agent Harness 概念兴起的核心动因。如果说模型是 Agent 的大脑,那么 Harness 就是让大脑真正进入世界并开展工作的操作系统,它涵盖了上下文管理、工具调用、运行环境、权限控制、风控机制、评估体系、追踪记录及反馈闭环。午方 AI 梳理发现,缺乏这套系统,再强大的模型也只能停留在对话框内;而拥有了它,Agent 才能真正具备执行复杂任务的能力。
互联网时代的传统判断框架,如 To-B 与 To-C 的二分法,在 Agent 时代正逐渐失效。过去软件的第一用户是人,因此优化重点在于界面设计、点击流程和文案引导。但在 Agent 时代,真正进入系统、读取信息、调用工具并发起操作的主体,已转变为代表人或组织行动的 Agent。这些智能体不关心页面美观度,只关注 API 的清晰度、Schema 的结构化程度、权限边界的明确性以及执行结果的可验证性。这不仅是交互方式的改变,更是接口假设的根本替换。To-Agent 维度的出现,意味着产品的直接调用者变成了智能体,其价值不再取决于传统的日活用户数(DAU),而在于能否成为大量 Agent 的默认调用层。午方 AI 注意到,若一个产品无法被 Agent 读取、调用和组合,即便面向人类用户体验完美,未来也可能被新的基础设施绕过。
过去一年,头部科技公司的动作看似分散,实则都在争夺 Agent 进入真实系统的入口。Anthropic 推出的 MCP(Model Context Protocol)旨在解决 Agent 如何安全连接外部数据源和业务系统的问题,而 Agent Skills 则通过类比新员工入职指南,帮助 Agent 获得专业工作流。其推出的 Claude Code 并非简单的代码助手,而是一个能读代码、改文件、跑测试并处理错误的长任务执行系统。OpenAI 的 AgentKit 同样聚焦于降低从原型到生产环境的部署难度,整合了构建、连接、评估和优化等工具。Coinbase 与 Cloudflare 推动的 x402 协议,则试图通过 HTTP 状态码将支付嵌入 Web 交互,使 Agent 能像交换数据一样完成价值交换。午方 AI 分析认为,这些动作共同标志着 AI 基础设施正从单纯的 Model Stack 扩展为包含连接、权限、支付、执行和验证的完整 Agent Stack。
在这一背景下,Bitget 的动作代表了垂直场景中另一种关键的入口争夺。与 x402 侧重支付协议或 AgentKit 侧重链上钱包不同,Bitget Agent Hub 直接面向交易执行场景,将 MCP、API、Skills 和 CLI 组合成一套完整的调用系统。Bitget 将其定位为 AI 时代的加密交易基础设施,旨在连接 AI 模型、开发工具与实时交易执行链。这不仅仅是交易所增加几个 AI 工具,而是试图回答一个更深层的问题:如果交易 Agent 要真正进入中心化交易所(CEX)场景,需要怎样的一整套 Harness?Bitget 已经迈出了第一步,但行业标准尚未形成。谁能将发现、接入、授权、执行、验证到复盘的链条做得更完整,谁就更有可能在交易 Agent 这一高价值场景中占据核心位置。
理解 Agent 时代的关键公式在于:Model 提供智能,Harness 提供执行系统。一个完整的 Harness 必须包含 Context(上下文)、Tools(工具)、Runtime(运行时)、Identity(身份与权限)以及 Guardrails(护栏)、Evaluation(评估)、Trace(追踪)和 Feedback(反馈)。午方 AI 研判指出,单独的工具层若无权限和风控,自动化越强风险越大;追踪若无身份授权,收集到的只是低质量日志。操作系统的价值在于各模块间的稳定协同,Agent Harness 亦是如此。未来的投资机会将集中在 Discovery 与协议层、Context 与 Skill 层、Runtime 与编排层、评估与可观测层,以及最具潜力的垂直领域 Harness。其中,法律、医疗、金融和交易等领域因任务价值高、错误成本高且数据闭环价值大,尤为适合构建垂直 Harness。
交易 Agent 是理解 Agent Harness 的最佳垂直案例,因为该场景将 Harness 的所有问题一次性放大。交易涉及真实资金,错误成本极高,执行需要严格授权,风控必须实时,且过程需可审计。一个成熟的交易 Agent Harness 应包含完整链条:从发现交易系统、明确身份权限,到调用行情、下单、撤单等工具,再到将任务拆解为研究、计划、执行和验证阶段。风控必须内嵌于系统,包括预算上限、最大杠杆、回撤限制和异常熔断,而非依赖事后提醒。评估维度也不能仅看盈亏(PnL),还需考量滑点、风险调整后收益及是否遵守用户目标。最重要的是 Trace,每一次交易产生的轨迹——包括市场状态、决策过程、工具调用、风控检查及成交结果——本身就是高价值的数据资产。
在交易 Agent 场景中,交易所处于独特的结构性优势位置。虽然模型公司提供推理能力,中间件提供工作流,钱包提供签名,但交易所掌握着托管账户、订单成交数据、市场深度、风控系统及 7×24 小时运行基础设施。这些资产使交易所离真实执行和真实结果最近,最有可能沉淀高质量的执行数据。Bitget 作为早期案例,其 Agent Hub 已覆盖现货、合约、跟单和理财等方向的 58 个工具,试图让交易所能力对 Agent 更可见、更可调用。
然而,工具暴露仅是起点,真正的分水岭在于能否解决 Agent 的默认发现、权限精细度、行为可追踪性及结果可验证性等深层问题。如果 Bitget 或其他交易所能向 Trace、Evaluation、Guardrails 及反馈闭环演进,交易所的竞争维度将从流动性和用户规模,进一步扩展到 Agent 原生的信任机制和执行数据资产。
Agent 时代的真正变革,在于 AI 从“会说”转向“做事”。一旦 AI 开始执行真实任务,基础设施将被重写,需要涵盖工具发现、权限获取、系统调用、支付结算、动作执行、审计评估及失败改进的全流程。从投资视角看,那些能进入高价值工作流、持续沉淀上下文、工作流、追踪记录、评估结果及产出数据的公司,将成为 Agent 时代真正的基础设施。未来的 AI 竞争将经历三次迁移:第一阶段比拼模型强度,第二阶段比拼 Agent 完成真实工作的可靠性,第三阶段则比拼谁能将每一次执行沉淀为下一次更好执行的数据资产。