登录
注册
2026 年 1 月,Andrei Karpathy 在社交媒体上公开批评 Claude 的编码习惯,直指其未经澄清即做假设、过度设计以及随意修改无关代码三大顽疾。Forrest Chang 迅速响应,将这些问题提炼为 4 条核心行为准则并封装进 CLAUE.md 文件。该文件上线首日即获 5,828 个星标,两周内被复制 60,000 次,至 2026 年 5 月星标数已突破 120,000 个,成为增长最快的单文件代码仓库。
然而,随着 AI 编程从单一代码生成向多步骤智能体协作演进,原有规则在应对钩子链触发、技能加载矛盾及跨会话中断等新故障模式时显得捉襟见肘。
午方 AI 梳理发现,作者耗时 6 周对 30 个代码库进行了深度测试,证实了初始 4 条规则在特定场景下能将错误率从约 40% 压降至 3% 以下。但面对 2026 年 5 月涌现的复杂场景,如智能体冲突和隐性逻辑遗漏,仅靠原有模板已无法覆盖。例如,模型在缺乏预算限制时可能陷入无限循环,曾有一次调试持续 90 分钟,模型反复处理同一段 8KB 错误信息并生成 40 种无效方案;而在多步骤重构中,若第 4 步出错且无检查点,后续步骤的完成反而增加了回滚成本。这些案例表明,原有的“简洁优先”和“谨慎修改”原则在长周期任务中出现了执行偏差。
为填补这一空白,作者在原有基础上增补了 8 条新规则,形成完整的 12 条行为契约。新增规则重点解决了模型在确定性逻辑上的随意决策问题,如 API 重试策略的随机化导致代码单元成本高达 0.003 美元;
同时强制要求模型在修改代码前必须理解上下文,避免像在某次事故中那样,因导入顺序问题覆盖已运行 6 个月的标准函数。
此外,新规则还针对“测试通过即成功”的误区进行了修正,防止模型编写出仅通过表面断言却破坏生产逻辑的代码,曾有一次认证功能虽通过 12 个测试用例,实际却因返回固定值而导致生产环境故障。
午方 AI 注意到,数据对比显示,规则数量从 4 条增至 12 条并未显著增加模型的认知负担,规则遵守率仅从 78% 微降至 76%,而整体错误率却从 41% 大幅下滑至 3%。这一结果的关键在于新规则精准覆盖了原有模板的盲区,如多代码库风格冲突、原型开发与生产环境的边界模糊等。测试表明,当文件长度超过 200 行或规则数量超过 14 条时,模型将转为基于模式识别而非逐条阅读,导致遵守率骤降至 52%。因此,保持文件精简且指令具体至关重要,避免使用“像高级工程师一样思考”等无法验证的模糊提示。
最终形成的 12 条规则体系不仅保留了 Karpathy 最初的 4 条基础,更针对智能体协作时代的特性进行了强化。例如,规则明确要求在编码前显式说明假设与权衡,禁止在无需抽象的场景引入复杂层,并强制在长流程任务中设置检查点。午方 AI 分析认为,这套规则的本质是将 CLAUE.md 从一份“愿望清单”转变为具有约束力的“行为契约”,每一条都对应着具体的故障预防机制。开发者可根据项目实际需求裁剪规则,但必须确保文件总长度控制在 200 行以内,以维持模型对指令的高遵循度。
随着 Web3 及 AI 开发生态的演进,多步骤智能体、钩子链及跨库协作已成为常态,单纯依赖自动补全的编码模式已难以为继。这 12 条规则的成功验证了从“生成代码”到“管理智能体行为”的范式转变。对于广大开发者而言,立即更新 CLAUE.md 文件并适配这 12 条规则,不仅是降低 38 个百分点错误率的技术手段,更是构建稳定、可维护的 AI 辅助开发工作流的关键一步。