推荐语
AI行业的壁垒并非技术领先,而是能否将算法落地为具体的“苦活累活”。核心内容:1. AI行业的壁垒转变:从模型到场景2. 行业语料、垂直流程和合规安全的三合一3. SoundHound如何打造AI应用“整机模板”
杨芳贤
53A创始人/腾讯云(TVP)最具价值专家
前阵子国内创投大佬朱啸虎发表了“AI 苦活累活论”引发了舆论战,“套壳应用不值钱,深度整合才是壁垒”, 应用场景是护城河起点,真正的壁垒不在于算法多先进,而是依靠算法做了很多苦活累活从而形成了自己的独特护城河,这也是我一直认为很多SaaS公司不会被大模型替代的核心所在,他们干了很多的脏活累活。本篇简单聊聊AI Agent的壁垒与苦活累活的关系。不可否认,当前整个AI行业已经进入了从“模型即卖点”到“场景即卖点”的阶段,大模型红利已成为公地,真正差异转向 行业语料 + 垂直流程 + 合规/安全 三合一。
苦活累活 ≠ 纯人力外包,而是“产品化脏活”,自动化测试、A/B、RLHF、模板化集成把人力转化为规模不敏感的成本结构。谁率先把隐性知识固化为 SaaS/PaaS,谁拿到高毛利护城。
数据飞轮是“苦活”最终升华,只有独占数据 + 自动回流管线,才能让模型持续演进并压制后进入者。
投资评估日常三问:
Data Moat:项目上线后能否源源不断回流独有数据?Integration Depth:是否已嵌进客户核心系统(POS/ERP/EMR)?Compliance Gate:有无被行业/法规“盖章”的必选组件?生成式/基础模型只是“芯片”,能跑商业场景的却是一台“整机”。palantir、SoundHound、tempus、serviceNOW等AI跑得快的公司,都是通过多年积累的行业Know-how + 全栈工程,把“苦活累活”产品化,变成客户可即插即用的 agent-AI Template。以去年异军突起的SoundHound为例,我简单分析一下公司是如何打造 AI 应用“整机模板”的:大模型只解决第 1 层;真正落地必须补完 2-6 层,而这恰恰是“大厂 API + 咨询”模式最薄弱的环节。2. “苦活累活”清单 & SoundHound 的工具化体现在哪些层面?难点一:语音高清洁嘈杂、回声、口音,传统都是拼拼凑凑第三方降噪库;手工收声学数据,而SoundHound通过Polaris 内置 20 年嘈杂语料 + 自研前端降噪;30 语种同一引擎,长期know-how体现在很多细节包括:领域噪音特征库:快餐油炸声、车内 AC 风、救护车等场景;难点二:业务 slot mapping,传统都是顾问团队手写 regex + 手工测试,而SoundHound通过行业 Starter Pack(餐饮/保险/能源)预置实体、对话流程,长期know-how体现在千万级真实会话提炼槽位语义表;难点三:系统集成,传统都是SI 一对一写中间件,而SoundHound通过REST/Socket 插件市场:POS、CRM、OMS、支付、一卡通,长期know-how体现在与 Toast/Oracle Hospitality/Adyen 等深度对接经验;难点四:智能体异常兜底,传统都是设计 fallback 分支,耗时,而SoundHound通过Agentic Plus 自动调二级子智能体 + 规则库;失败率 <5 % 时才人工,长期know-how体现在Fail-safe 策略:10 年车载安全标准积累;难点五:安全合规,传统都是额外采购 Pindrop/Kount 等方案,而SoundHound通过声纹验证 SDK + Tokenized Card 支付 + HIPAA 模板,长期know-how体现在,跨国法规映射表(GDPR, CCPA, PCI, HIPAA);难点六:ROI 量化,传统都是BI 团队手工报表,而SoundHound通过CFO-Ready Dashboard 自动算 FTE 节省、Upsell lift,长期know-how体现在行业标杆库:QSR 工时成本、呼叫中心座席全成本。
- 技术层面,不依赖单一 LLM,采用 裁缝式混合:Polaris 精调短时语音意图;GPT-4o 负责推理; Internal Deterministic Agent 处理支付流程。
- 数据层面,场景专属语料壁垒:十年真实对话 > 版权受限;难以简单抓公开语料复制。
- 运维层面,Auto-Tuning Pipeline + 自监控,让 N×客户 运维成本呈亚线性增长。
- 财务层面,模板化降低实施人力,PoC 成本封顶 → 毛利率回升是可预见的。
- 客户层面,交付速度从“项目制 6 个月” → “模板开箱 4 周”,直接缩短 CIO 付款周期。
所以说,SoundHound 的核心竞争力不只是依赖大模型,而是一套经过十多年“脏活累活”打磨的 Voice-AI 整机模板。这种模板化让客户低风险尝试 → 快 ROI 放大 → 长期高毛利订阅,形成技术+运营双重护城河。在 AI 落地进入 “微垂直深度打磨”时代,谁能把看不见的集成细节产品化、规模化,谁就能把模型红利真正变成 持续现金流与数据飞轮。朱啸虎口中的“苦活累活”正是 SoundHound 等垂直 AI 公司真正的护城河来源。对于投资人,评估一个 AI 项目是否值得长期持有,要看它是否已把这些“脏活”产品化、数据化、自动化——否则只是又一个随时可被大模型 API 替代的“套壳”。“脏活累活”造就 AI 深护城河:美股科技公司巡礼
下列公司都是典型的聚焦靠长期数据采集、业务流程重塑、行业合规打磨而非纯模型参数堆砌,真正沉淀出 AI 护城河的代表性公司。公司的AI产品也瞄准帮助企业处理更多的“脏活累活”,节省更多的人力物力。
ServiceNow (NOW),关键 AI 资产 & 苦活累活包括十余年 ITSM & HR 流程语料,CMDB 拓扑 & 事件语义表• 4,000+ 现成工作流模板;Now Assist:GenAI 助理自动生成工单、变更步骤,工单级 Agent + 深系统集成;Salesforce (CRM),关键 AI 资产 & 苦活累活包括全球最大 CRM 数据宇宙(商机、活动、呼叫日志),1.5×10¹² 条元数据,AppExchange 数万插件生态;AgentForce(Einstein 1 Studio):多智能体自动跟进商机、生成邮件,典型苦活:整理标准对象+行业模板;Palantir (PLTR),关键 AI 资产 & 苦活累活包括国防/制造/能源 模型-流程 数仓,数据治理 + 纵深安全标签;AIP:预测维护、供应链 RAG Copilot,深度数据整形+安全苦活;Intuit (INTU),关键 AI 资产 & 苦活累活包括400M 纳税/账簿实例+分类语义,法规更新→规则库持续维护;Intuit Assist:自动税务答疑、现金流预测,会计科目与法规模板;CrowdStrike (CRWD),关键 AI 资产 & 苦活累活包括2万B/day 威胁遥测 → Threat Graph, TI 团队手动标签+机器学习迭代;Charlotte AI:安全 Analyst Copilot,部分:需要人类威胁追猎累活;ServiceTitan (TTAN),关键 AI 资产 & 苦活累活包括家装/空调/水管数百万工单语料,技师路由、报价规则;Titan Intelligence:自动估价、派工,行业超垂直、高迁移成本;Adobe (ADBE),关键 AI 资产 & 苦活累活包括20 年创意资产标签 + 行业色彩/版式规则,合法可商用素材库;Firefly & GenStudio,素材清洗与版权苦活;Datadog (DDOG),关键 AI 资产 & 苦活累活包括,6500+ 技术组件 metrics schema + tag_vocab,自动 Anomaly 基线调参;Watchdog AI:自愈警报/根因分析,数据接入苦活多,业务流程少;FICO (FICO),关键 AI 资产 & 苦活累活包括3 信用局排他+ML 监管模型文档,线上线下欺诈反馈循环;FICO Platform Explainable AI,模型即标准+监管苦活。
上述公司存在什么共性呢?算法价值 = 数据垂直度 × 流程耦合度 × 合规难度
- 垂直数据私域,ServiceNow百万企业工单;Intuit 纳税样本 —— 外部无法合法复制。
- 流程 & 插件生态,Salesforce Standard Objects + AppExchange;Palantir Foundry Pipeline。迁移成本 ≫ 模型 fine-tune 成本。
- 合规“苦功”,金融信贷、医疗、国防领域 → 先发拿下审计/安全认证,一步卡死后入者。
- 持续治理工具链,自动标签、反馈、灰度回滚(NOW, DDOG)让“苦活”递减边际成本,新客户越多,竞争门槛越高。
所以,为什么“苦活累活”难被大模型 API 消灭?
对话生成层面,LLM API 能力极强,语义、语法近乎完美,苦活累活难点在于行业词槽、实体对齐:需真实业务事件喂养;
任务编排层面,Agent 能调 REST,苦活累活难点在于流程状态机:必须保证事务一致、权限、审计;
决策/预测层面,少样本推理,苦活累活难点在于标签分布偏差、负向样本难采 (欺诈/罕见故障);
合规层面,可补插件,苦活累活难点在于多法规交叉+实时监控,靠 组织流程 而非 API。
所以,前阵子市场对于大模型吃掉软件行业的担忧可以阶段性缓解了,AI应用的复杂程度远超普通SaaS应用,普通有的都要有,另外还要加一层AI,AI还要各种治理,在devsecops环节复杂度就明显提升了很多(以jfrog的devsevops架构模型为例)。
AI App 在 DevSecOps 全链条多出 3 个维度:
- 模型(重量级二进制 + 权重安全)
- 数据(训练/微调数据来源、隐私)
- 推理(运行时成本 + 行为安全 + 伦理)
为什么AI 软件业比过去更复杂?
-
多模型调度,一条业务链可能同时调用自家专用 LLM + GPT-4o + open-source TinyLLM,依场景取长补短。
-
数据/模型双向漂移,语义意图、用户行为和模型权重同时变化,需要 A/B 与在线学习持续监控。
-
“Agentic” 任务分解,单层 ChatGPT 变多智能体协作(Planner-Executor-Critic),每层都有故障点与安全边界。
-
实时 ROI 量化需求,CFO 要求分钟级看到成本/收益;SaaS 要嵌入 FinOps、Usage Metering、边际成本可见化。
- 合规与安全堆栈更厚,从传统 SSO/LDAP + SOC2,升级到 声纹验证、RAG 引用可追溯、Prompt 防注入、隐私微调。
所以,大模型≠“软件终结者”,它们只是把“算力-算法”这一层暴力提速;而把模型变成可持续、可交付、可审计的商业价值,依旧离不开 SaaS 厂商几十年磨出来的“脏活苦活累活”——数据治理、流程编排、权限体系、合规封装、持续运维。眼下市场情绪已从“LLM 一统江湖”回落到更理性的“AI-Native 应用栈”,主要有五个共识正在形成:1. 模型同质化,语义/流程差异化,模型性能差距变窄,真正壁垒来自私域语料和深垂直流程,SaaS 厂商应把行业知识图谱、Best Practice 工作流固化进模板,形成“数据+流程”双锁。
2. AI 成本曲线下降,但运维复杂度上升,推理单价跌 >90%,但多模型编排、监控、版本管理难度飙升,平台需要提供 LLM Router、指标监控、可解释性,SaaS 运维价值反而提高。
3. CapEx→OpEx 转换正在加速,企业先用月度订阅试水 AI,ROI 通过后放大用量,SaaS 模式天然适配按量计费,可用 PoC→扩容模型吃到第二波增长。
4. 合规成为决策入口,数据驻留、AI 可信评估、行业特定法规(HIPAA/PCI),内置合规模板、自动化审计报告的厂商更易获大单。
5. 生态整合取代单点竞赛,“模型→中间件→流程→前端”呈链式协同,孤岛工具将被抛弃,SaaS 需开放插件接口,与其他 SaaS / SI / CSP 互通,形成生态锁定。
重点关注什么?
- 看“插件粘性”:垂直 SaaS 是否已把 LLM 变为“发动机”,而驾驶舱、车架、轮胎都是自家?
- 评估“苦活自动化比”:越自动化,边际毛利越高——ServiceNow & Salesforce 的第二曲线就在这里。
- 关注“监管前壁垒”:FICO、Intuit、Palantir 先把监管串进 AI pipeline——后进者难打穿。
AgentForce 值得追踪:如果 Salesforce 真能把销售/客服/营销全流程的 Agentic Copilot 模板化,并用巨大 CRM 数据飞轮持续迭代,它会是“苦活累活”护城河的又一个 textbook。从行业层面来看,正式进入到AI agent为主的应用阶段,机会不容错过。1 | 云端 GPU 已砸,资本支出只是“错峰”而非“骤停”微软:对外声称“slowing early-stage projects”,但 2025 预算不变,实际只是调序排队。亚马逊:暂停新园区备案,却在已获批园区增购 H100 机柜——电力与冷却瓶颈才是真正掣肘。CapEx 降速≠投降,而是“先吃库存 → 后补新地”。对 SaaS 供应商是利好:可低价拿 GPU 时隙。
2 | API 价格腰斩,AI PaaS 进入“平价时代”
OpenAI o4-mini 输入 $1.1 → Batch $0.55 /M tokens,等同 GPT-3.5 早期十分之一成本。Anthropic Claude-Haiku 亦给出 <$0.50/M tokens 压价。对比呼叫中心人力 $1.2–1.6/通话分钟,多轮对话成本已足够打穿 ROI。
3 | 应用侧“纵深推进”三条清晰的正例
SoundHound、ServiceNow、Verint:嘈杂 ASR + Agentic;北美 QSR 门店渗透率仍<5 %,同店 ROI <12 月、交互一次解决率 >90 %。
ServiceNow Now Assist 每月处理 5亿+ 事件;微软 Copilot for Security 公测量破 20k 租户,减少 MTTR >40 %、工单手写 -60 %。
PwC、Deloitte 内部 3–6 月就把检索-生成应用推到所有顾问桌面,单顾问人效 +15–20 %,邮件/报告时长腰斩。
宏观杂音之下,企业在 客服、营销、供应链 这三条“数据现成 + KPI 显性 + 合规成熟”的跑道,已进入 规模化落地拐点:PoC 成功率 > 60 %,说明技术验证门槛已被成本拐点击穿;55 % 投产率,则标志着“从试验室到产线”的通道已打通。
下一阶段,真正的胜者将是那些能把 苦活累活产品化、迅速将 PoC 复制到更多流程,并将用量转化为 高毛利订阅 或 交易抽佣 的垂直 AI 供应商。
4 | 底线认知
GPU CAPEX ≠ AI EPS:重资本阶段,盈利要看 OpEx 拉新速度 而非 CapEx 增速。降价是助燃剂:成本拐点不代表泡沫破裂,而是“用例拐点”前兆;Mobile-Cloud 时代曾多次重演。产业叙事生根在 ROI 而非宏大的梦:真正决定冷暖的,不是巴黎厅 pre-money,而是一个个 业务工单、语音订单、自动票据。Everyone is macro trader?反身行情常在——但微观现金流胜过宏观段子。越是“人声鼎沸的宏观日交易者”,越可能错过深水区的应用进化。风浪越大鱼越贵,外部风高浪急,但 AI 的“碳基苦活 + 硅基算力”正好同步降本——宏观噪声掩盖下,应用加速的信号正在底层 KPI 悄然放大,真正的 α 将来自能把降本红利转化为高毛利订阅、交易抽佣的垂直玩家,而不是日常被情绪放大又缩小的“关税 headlines”。
对投资与产业的 4 点启示:
大模型降维打击的是“通用 API 层”,而不是“整机式流程 SaaS”。谁能把领域数据、流程 Know-how、合规安全 一次性封装,谁就能在 AI 时代拿到粘性最高、Margin 最厚的那块蛋糕。对投资者而言,关注那些 NRR 持续 >120 %、毛利率提升且 CapEx 轻 的 AI-Native SaaS,才是穿越模型迭代的稳健选择。
API 降价 + 现成数据 → 使“AI 试点”门槛大幅下降;真正的分水岭是 能否迅速迭代模型→流程落地。传统 IT CapEx 项目审批 6–9 月;而 OpEx 订阅由业务部门主导,销售周期缩到 2–3 月。客服 → 直接节省座席 FTE;营销 → 增量 GMV;供应链 → 减库存、提 OTIF(准时到货率)。这三条线最先形成 高可观测 KPI,方便 CFO 批款。成功 PoC 的共同特征:有专属语料 + 深度系统集成(IVR、CRM、WMS、TMS)。仅凭调用开源 LLM API 难以穿透最后一公里。全文完。