跳至内容

AI 生产力的唯一落点

2026-05-17

晚上和炎明吃饭,聊到 AI 的实际应用。几杯酒下去,话题从宏大叙事落到日常体验。我俩有个共同感受:

AI 目前能有生产力的,只有 coding 这一项。

这是一个残酷但诚实的判断。

为什么只有 Coding

仔细想想,Coding 和其他场景有什么本质不同?

第一,输出可验证。 代码跑不跑得通,一运行就知道。结果客观、即时、无歧义。AI 写对了就是对了,错了就是错了,不存在"写得好不好"的主观拉扯。

第二,反馈闭环极短。 写一段代码 → 编译/运行 → 看到结果 → 修改,这个循环可以秒级完成。AI 和开发者之间形成了高频的"对话-验证-迭代"机制。

第三,错误可容忍。 代码写错了不会死人。你可以反复试错,直到跑通为止。这种低代价的试错环境,是 AI 学习和人类协作最舒服的区间。

第四,人类判断力最低介入。 代码的逻辑正确性由机器判定,不需要专家逐行审阅。非技术类任务(写文章、做设计、决策建议)都需要人的判断力做最终把关——这恰恰是最稀缺的。

其他场景为什么不行

  • 写文章 → 需要人类判断风格、语气、事实准确度,改了半个小时不如自己写
  • 数据分析 → AI 能跑数,但"问对问题"才是关键,而这个恰恰是 AI 做不到的
  • 创意设计 → 生成一堆选项,人类从中选一个最不差的,本质是降本不是提效
  • 聊天陪伴 → 有情绪价值,但没有产出,不算生产力

这些场景的共同问题:判断成本转移了,但没有消失。 写文章的时候,AI 帮你省了打字的力气,但审稿的时间一点没少。效率提升只是把体力活变成了脑力活。

Coding 也是例外,也是范式

但仔细想,未来真正有生产力的 AI 场景,都会呈现出某种"可验证性"——无论是否在写代码。

比如合同审查:如果有一套明确的合规规则,AI 可以逐条校验;比如医疗影像:如果有标注好的数据集,AI 可以辅助诊断。这些场景的共同特征都是:输出可以被客观判定对错。

而那些依赖人类主观判断的领域——策略、审美、人情世故——AI 很难产出真正的生产力。不是技术问题,是评价标准的问题。

写在最后

和炎明的一顿饭,让我更清楚了一件事:AI 不是万能工具,它是一把专门在"可验证"领域发力的扳手。

承认它的边界,比鼓吹它的全能,更有意义。

而当前这把扳手最趁手的活,就是 coding。这也是为什么从大厂到个人开发者,都在往这个方向猛押注——不是跟风,是因为这里真的能看到产出。