从13.37%到3300亿:AI产业“龙虾化”正在重写价值坐标
当Agent持续开发成功率仅13.37%,AI行业却迎来700亿流量与千亿估值。真正的分水岭不在模型参数,而在工程闭环、产业渗透与安全韧性。
过去一年,AI行业最戏剧化的矛盾是:一边是流量与估值狂飙,另一边是工程现实频频“翻车”。EvoClaw对OpenClaw类持续开发任务的研究,把问题挑明了:Agents在长链路、连续迭代中的成功率仅13.37%。这不是一个小瑕疵,而是产业从“可演示”走向“可交付”时必须面对的断层。
很多人把这视为技术问题,我更倾向于把它定义为“系统能力赤字”:模型会写代码,不等于系统能稳定演进;Agent能完成单次任务,不等于能承担生产责任。13.37%背后暴露的是三个短板:目标漂移控制不足、上下文记忆污染严重、回滚与验证机制薄弱。换句话说,行业真正缺的不是更会说话的模型,而是更像工程团队的AI系统。
这也解释了所谓“产业龙虾化”为什么会成为AItoB下一个战场。龙虾有坚硬外壳和高价值肉体,映射到产业里,就是“硬流程+高价值节点”:谁能嵌入企业真实流程、扛住合规与稳定性要求,谁就能获得高毛利与长期合同。未来两年,AItoB不会被最炫的通用能力定义,而会被三类能力定义:流程穿透深度、组织协作适配度、故障可解释性。
在这个框架下再看“MiniMax值不值3300亿”,答案不应停留在情绪化站队。估值成立与否,取决于三条可验证主线:第一,收入结构是否从API调用走向业务结果分成;第二,产品是否形成跨模态与跨场景复用的分发网络;第三,是否建立了安全与治理护城河。若只能依赖短期流量红利,3300亿是高波动预期;若能把模型能力沉淀为行业基础设施,3300亿可能只是中继站。
“700亿流量狂欢”本身并非坏事,它证明AI已进入大众认知层面的基础设施时刻。但流量不是终点,而是昂贵的前菜。真正的产业革命发生在流量之后:从点击到交易、从工具到岗位、从试点到制度。谁能把用户增长转译为企业经营指标,谁才能穿越下一轮估值重估。
而“真有人给龙虾投毒”这类事件,提醒我们另一个被低估的现实:AI产业正在进入对抗时代。数据投毒、提示注入、评测污染、供应链后门,都可能让看似优秀的模型在关键场景中失真。未来企业采购AI,不会只看能力榜单,而会看“安全账本”:训练数据来源可追溯、推理链路可审计、异常行为可熔断。安全不再是成本中心,而是成交门槛。
因此,接下来行业应从“模型竞赛”转向“系统竞赛”。我建议用三项新指标替代单一参数崇拜:自主闭环成功率、单位算力价值密度、安全韧性指数。前者决定能否落地,中者决定能否赚钱,后者决定能否活下来。
13.37%不是悲观数字,而是清醒信号。它告诉我们:AI的上半场靠想象力,下半场靠工程力;上半场拼速度,下半场拼韧性。谁先完成这次认知切换,谁就能在“龙虾化”的新产业秩序中,吃到最厚的一块肉。