当AI进入“龙虾化”时代:13.37%成功率、3300亿估值与700亿流量背后的真实分水岭
从EvoClaw揭示的工程失效率,到MiniMax估值争议与“投毒”风险,AI产业正从流量竞争转向系统可靠性、行业渗透与安全治理的深水区。
过去一年,AI行业最危险的错觉是:流量增长可以替代产业成熟。EvoClaw对持续开发型Agents的研究给出了冷水——在长期、多轮、真实约束的代码演进中,成功率仅13.37%。这不是一个“模型还需优化”的小问题,而是对当前AI工程范式的结构性警告:我们在Demo层面跑得太快,在生产层面站得不稳。
所谓“OpenClaw代码越改越崩”,本质上暴露了Agent系统的三重脆弱性:上下文漂移、目标错配和回归失控。模型在局部任务上能给出高质量补丁,但在跨模块、跨版本、跨时间的连续迭代里,缺乏稳定的软件工程记忆与验证闭环。换句话说,AI会“写代码”,但还不真正“懂系统”。这意味着下一阶段竞争不在参数规模,而在可验证开发链路:测试覆盖、回滚机制、变更审计、风险分级与人机协同协议。
这也解释了“产业龙虾化:AI to B的下一个战场”为什么成立。龙虾有硬壳与软腹的二元结构,正像今天的AI产业:外壳是大模型能力、融资故事和流量叙事;软腹是企业场景里的交付复杂度、流程耦合与责任边界。to C可以先靠体验突破,to B却必须回答三个硬问题:谁为错误负责?如何与存量系统共存?ROI在几个季度内兑现?
因此,MiniMax“值不值3300亿”不应只看用户规模或模型榜单,而要看它是否具备产业级“反脆弱资产”:稳定推理成本、行业知识沉淀、交付伙伴网络、可监管接口和安全合规能力。高估值并非原罪,但如果估值建立在“未来会发生”而非“已经可复制”的商业闭环上,资本最终会把技术叙事改写成现金流审判。
“700亿流量狂欢”则是另一面镜子。流量可以证明需求真实,却不能证明价值可持续。AI产品正经历从“注意力经济”向“信任经济”迁移:用户愿意尝鲜,不等于企业愿意托底关键流程。任何一个高频场景,只要出现稳定性波动、幻觉外溢或数据泄露,增长曲线就会迅速折返。未来两年,决定胜负的不是DAU峰值,而是故障率、续费率与单位价值密度。
“真有人给龙虾投毒”这件事,提醒行业进入了对抗时代。无论是训练数据污染、提示注入、RAG检索污染,还是Agent工具链被恶意操纵,都在说明AI系统已成为新型攻击面。过去我们讨论的是“模型聪不聪明”,现在必须讨论“系统安不安全”。没有安全治理的AI to B,规模越大,风险敞口越大。
我更倾向于把当下定义为AI产业的“第二曲线起点”:第一曲线是模型能力跃迁,第二曲线是工程可靠性、行业深嵌与安全治理。前者决定天花板,后者决定生死线。EvoClaw的13.37%不是悲观数据,而是重新定价行业价值的坐标系:谁能把成功率从13%提升到60%,谁就可能吃下下一轮企业级红利。
接下来最值得关注的,不是谁再发一个更强基座模型,而是谁先形成“可持续交付飞轮”:模型能力—工具链—行业流程—安全合规—商业回款的闭环。一旦闭环形成,估值才有锚,流量才有沉淀,所谓“龙虾化”也将从被动防御转为主动进化。
AI行业真正的分水岭已经出现:不是会不会写代码,而是谁能在真实世界里持续、不出事地把代码变成生产力。