Harness Engineering 学习与实践

张开发

• 2026/4/7 20:00:34 • 15 分钟阅读

分享文章

一、核心含义Harness 的英文原意是“马具”包括缰绳、鞍具等用来控制马匹的方向和力量。借用到AI领域Harness Engineering 就是为AI Agent“套上缰绳”、构建控制系统的工程实践。它强调不是去进一步优化AI模型本身Model而是优化模型运行的“环境”Harness让Agent在人类设定的边界内自主、可靠、可持续地工作。核心理念一句话总结“Humans steer, Agents execute”人类掌舵智能体执行。工程师的角色从“手动写代码”转变为“设计AI的工作系统、环境和控制机制”。二、为什么会出现 Harness Engineering随着AI模型如Claude、Codex等能力大幅提升能自主生成大量代码甚至百万行代码的项目传统 Prompt Engineering提示工程或单纯的 Context Engineering上下文工程已不够用。问题包括Agent容易“跑偏”、幻觉、陷入循环或犯重复错误。长时任务、复杂项目中上下文窗口有限、记忆不持久。缺乏可靠的反馈、验证和纠错机制导致输出不可控或质量不稳定。OpenAI 等公司在内部实验中发现当完全不让人手写一行代码、全部靠Agent完成百万行代码项目时关键不是换更强的模型而是重新设计Agent运行的环境。于是 “Harness Engineering” 这个术语被正式提出和推广。三、Harness Engineering 的主要组成部分一个完整的 Harness 通常包括以下几个关键模块不同资料表述略有差异但核心一致约束机制Guardrails / Constraints定义规则、架构边界、权限控制避免Agent做危险或无关操作。反馈回路Feedback Loops实时验证、测试、观测Observability让Agent自我纠错或人类干预。上下文管理Context Engineering动态提供知识库、文档、当前状态确保Agent“知道自己在哪、该做什么”。工作流控制与工具集成Workflows Tools编排多步任务、调用外部工具、内存/状态管理。持续改进与垃圾回收Continuous Improvement Entropy Management清理无效上下文、积累经验、防止系统“熵增”混乱积累。本质上Agent Model大脑 Harness操作系统/缰绳。Harness 决定了模型的智能能否真正转化为可靠的生产力。与相关概念的区别Prompt Engineering关注单次输入提示的优化已较早期。Context Engineering更广义地管理Agent看到的上下文Harness 的子集或前身。Harness Engineering上升到系统级、全生命周期的工程实践包含架构约束、反馈闭环、环境设计等更注重长期可靠性与规模化。实际意义与应用在软件开发中工程师设计规格、架构文档、验证流程让AI Agent 自动写代码、跑测试、修复 Bug。企业/团队层面从“AI辅助编程”进化到“AI主导执行人类主导设计”。未来趋势被视为AI Agent 时代软件工程的新范式已有相关实践、工具和讨论在硅谷、OpenAI 等快速传播。简单来说Harness Engineering 解决的核心问题是如何让强大的AI不失控地、稳定地完成复杂真实工作而不是单纯追求模型参数更大或提示词更巧妙。四、使用Ralph实践1.创建AGENTS.md如果使用Claude需要添加软链接ln AGENTS.md CLAUDE.md或者重命名为CLAUDE.md你是一个经验丰富的 Harness Engineering 专家正在使用 Ralph Wiggum Loopsnarktank/ralph从零搭建项目。当前项目是全新的 git 仓库刚刚做了 initial commit。 ## 你的唯一任务只做这一件事不要开始实现任何业务功能理解我对项目的整体需求见下方描述。使用 PRD Creator 的思维方式生成一个**结构化、细粒度、可执行**的 PRD。将 PRD 拆解成多个小用户故事user stories每个故事要足够小理想情况下 1-2 个小时内可完成。输出 scripts/ralph/prd.json 文件格式严格遵循 snarktank/ralph 的要求包含 id、title、description、priority、passes: false、branchName 等字段。同时创建或更新以下文件 - PRD.md 或 docs/prd.md人类可读版本 - progress.txt初始为空或只有 header - AGENTS.md写入项目约定、编码规范、架构决策、质量门控规则等最后创建一个 setup.sh 或 dev.sh 脚本用于启动开发服务器、运行测试等。项目需求描述 [在这里详细写你的项目一句话或多句话描述例如 “构建一个简洁的个人任务管理工具Todo App支持用户注册/登录、创建/编辑/删除任务、任务优先级和截止日期、简单的看板视图。使用 Next.js 15 TypeScript Tailwind shadcn/ui Supabase 作为后端。需要移动端友好支持暗黑模式。”] 严格规则 - 每次只完成一个小步骤不要一次性做完所有事。 - 完成后请 commit 更改并输出总结“PRD 和初始 harness 已准备好可以开始运行 ./scripts/ralph/ralph.sh 进入自主循环。” - 优先级从高到低排序核心 MVP 功能。 - 强调质量门控每个故事完成后必须能通过 build / test / lint。现在开始工作。2.初始化仓库git init3.安装Ralph仓库地址https://github.com/snarktank/ralph有三种方式下载Ralph仓库文件复制到当前项目下载Ralph仓库文件复制到 Amp/Claude Code 的全局配置目录使用Claude插件市场添加一键安装所有技能本人使用方式三# 添加插件市场 /plugin marketplace add snarktank/ralph # 安装Ralph /plugin install ralph-skillsralph-marketplace # 刷新插件 /reload-plugins # 如果没有 /ralph命令就退出重新启动claude /exit claude4.执行Ralph通过内置 /prd 技能由 AI 生成结构化的 Markdown 格式 PRD需回答 AI 的澄清问题文件保存至tasks/prd-[feature-name].md通过 /ralph 技能将 Markdown PRD 转换为 JSON 格式的prd.json该文件包含带优先级、完成状态的用户故事是 Ralph 的核心执行依据生成如下文件表示成功

更多文章

前端开发 2026/4/7 20:00:10

HarmonyOS6 ArkTS scrollbar 设置子节点

文章目录HarmonyOS6 ArkTS ScrollBar 设置子节点ScrollBar 子节点概述核心作用核心 API 说明1. ScrollBar 组件构造2. 子节点规则3. 关联组件（Scroll Scroller）完整代码代码核心要点解析1. 父子组件绑定2. 系统滚动条关闭与自定义3. 子节点（…

第一章：UE6.5 C27 调试能力演进与基准定位Unreal Engine 6.5 首次原生支持 C27 标准子集，并深度整合了 Clang 18 的调试元数据增强特性，显著提升了符号解析精度与运行时诊断能力。相比 UE5.4 中基于 DWARF-5 的有限 C20 支持，UE6.…

张开发

前端开发 2026/4/7 19:29:30

电机控制-MOS驱动和MOSFET如何匹配的,并计算栅极驱动电阻

驱动和MOSFET如何匹配一、MOSFET驱动匹配1、匹配的核心：驱动电流和栅极电荷2、如何匹配3、应用匹配性检查4、总结：匹配要点一览二、栅极串联电阻计算第一步：理解电阻的角色（开通 vs. 关断）第二步：估算初始电…

张开发

Harness Engineering 学习与实践

最新文章

36个恶意npm包利用Redis和PostgreSQL部署持久化植入程序

斯坦福SCI论文写作课精华笔记：从图表到讨论的7个实战技巧

OpenAI发布政策文件关注AI对金融领域的影响与风险

3大核心功能：拯救者笔记本开源性能优化工具深度指南

2026届必备的五大降重复率网站实测分析

TranslucentTB任务栏透明美化工具：从安装失败到完美运行的完整指南

推荐文章

AVR长周期看门狗库：突破8秒限制实现毫秒级精准复位与睡眠唤醒

并发控制原理与实现：从进程线程到现代并发编程

HunyuanVideo-Foley开源大模型实战：基于Transformers/Accelerate推理优化

小步快跑・像CPU一样调度大脑高并发——东方仙盟・阿雪心学

STM8 Bootloader开发与固件远程升级实践

（复现）基于自适应滑模控制（ASMC）和神经网络容错控制的主从式无人机编队控制研究（Matlab代码实现）

相关文章

深入解析ZeroMQ inproc：线程间通信的高效实现与性能优势

BewlyBewly终极指南：打造高效个性化的B站浏览体验

IDM激活脚本架构设计：基于注册表锁定机制的99%成功率激活方案

Sulpho-Methyltetrazine-NHS ester，磺化甲基四嗪-琥珀酰亚胺酯的结构特点与功能

3步精通Zotero OCR：从安装到高效文本识别

OpCore-Simplify：驯服硬件兼容性的自动化引擎

分享文章

更多文章

HarmonyOS6 ArkTS scrollbar 设置子节点

音频频谱分析师的成长之路：Spek实战秘籍深度解锁

联想小新Pro 16蓝屏问题全面排查与修复指南

csdn-ai团队文档管理

AI辅助开发：描述策略逻辑，让快马生成双均线交易回测Python代码

探索BCI Competition IV 2a数据集：3个深度实践技巧与运动想象解码的完整指南

多语言支持功能实现与配置指南：面向全球化用户的本地化解决方案

相场模拟——合金，金属凝固模型，各向异性枝晶生长karma 合金凝固模型，选区激光熔融，激光增...

小型风冷氢燃料电池市场：68.65MW产能下的行业新态势

八大网盘直链下载助手：免费获取高速下载链接的完整指南

UE6.5调试性能对比实测：Clang 19 vs MSVC 17.12 vs GCC 14.2（C++27特性支持度+调试信息完整性双维度TOP1）

电机控制-MOS驱动和MOSFET如何匹配的,并计算栅极驱动电阻