我要投稿

AI 时代的提示工程：打造高效智能代理的系统指南

发布日期：2025-08-05 20:30:32 浏览次数： 1902

作者：二进制杂货铺

微信搜一搜，关注“二进制杂货铺”

曾几何时，Prompt（提示词）被视为与大型语言模型（LLM）交互的一种“临时方案”。但随着 AI 技术的迅猛发展，它已经跃升为 AI 系统能否高质量输出的核心变量。

本文将结合 Y Combinator 旗下 S24 孵化项目 Parahelp 的实践经验，以及 YC YouTube 视频《State-Of-The-Art Prompting For AI Agents》的精彩内容，带你深入理解：如何通过提示工程（Prompt Engineering），构建真正智能、可控的 AI 代理（Agent）系统。

视频参考
-- 来源：Y Combinator（YouTube）
-- 标题：State-Of-The-Art Prompting For AI Agents
-- 正如视频简介所说： “提示起初看似只是临时变通，目的是最大限度发挥 LLM 能力。但如今，它已成为我们与 AI 交互方式的关键。”

一、提示结构要素:Prompt ≠ 文本，而是逻辑代码

01、角色定义

给模型明确身份，让它知道“我是谁”。

如Parahelp 的 Manager Prompt——“你是一个客服代理的经理，职责包括监督工具调用、评估任务执行、提供反馈等。”这种角色设定为模型提供了行为边界与判断准则。

Parahelp 是一家专注于 AI 客服与代理系统的科技公司，其官方Prompt设计博客公开了核心设计理念：提示链接如下:https://parahelp.com/blog/prompt-design

Parahelp开源了其部分核心Prompt，包括“manager”Prompt和部分“planning”Prompt。

•Planning Prompt（规划提示词）：

•Manager Prompt（经理提示词）：

02、任务分解

将复杂任务拆解为可执行步骤。

如 Parahelp 工具调用审批流程的五步法：

1.分析调用目标

2.检查上下文完整性

3.比对业务政策

4.判断风险边界

5.给出批准/拒绝+理由

通过结构化步骤，引导模型“逐步推理”。

03、输出格式控制

用 XML 风格标签强化结构，比如： <accept_tool_call> Reason: Tool meets business policy. </accept_tool_call>这使模型响应便于自动解析、测试与部署，适用于 API 场景。

04、Markdown结构清晰

用清晰标题、列表、缩进提升提示语的“可编程性”，增强 LLM 的语义理解能力。

二、提示的三种类型

01、系统提示（System Prompt）

定义公司范围逻辑的核心“API”（例如，Parahelp 的 6 页提示）。

02、开发者提示（Developer Prompt）

嵌入客户/业务特定规则，在系统提示基础上动态注入。

03、用户提示（User Prompt）

面向终端用户，常见于 Web 工具或 B2C 产品，例如，Replit 的“使用这些按钮生成网站”

三、元提示技巧

01、自我优化

让LLM批改自己的提示。例如：

输入：“你是一位专业的提示工程师。请批评此提示：[原始提示]。”
输出：增强提示，提供更清晰的指示

02、提示折叠

动态生成专属子提示，如 Trope 用分类器自动匹配不同意图的子提示模板。

03、逃生口机制

让LLM可以说“不知道”或请求澄清。如YC 的“debug_info”参数，其中 LLM 报告令人困惑的要求。

04、模型蒸馏

使用更大的模型（GPT-4、Gemini 1.5）来设计更小、更快的模型（例如 Mistral）的提示。如：需要低延迟响应的语音 AI 代理。

四、提示工程配套工具

01、示例注入

用经典难题样例训练推理路径。例如：Jasperberry 通过注入专家级示例（例如，N+1 查询错误）来自动查找代码错误。

02、Evals测试

Parahelp 认为评估是他们的“皇冠上的宝石”（而不是提示本身）。好的提示 = 多轮测试驱动出来的。

03、推理链分析

①将模型“思维过程”+“原始Prompt”一起送入Gemini Pro，并要求他对提示提出一系列编辑建议，以便将他们很好地结合起来。

②在Gemini 2.5 Pro中显示 step-by-step 的思考过程，用于复盘失败原因并优化提示。

五、创始人视角：FDE模型

01、什么是FDE（Forward-Deployed Engineer）？

创始人 / 工程师亲自下场，深入用户流程、嵌入产品逻辑，持续迭代提示与功能。

例如：

Giger ML：工程师与支持团队一起优化语音响应延迟。
快乐机器人：创始人通过为经纪人定制提示达成了 7 位数的物流交易。

02、典型打法

用户需求 → 快速修改 Prompt → 在线演示 → 锁定合同

六、模型个性化与评分机制

01、GPT-4

严守评分机制的“士兵型”。

02、Gemini 1.5

灵活处理边界情况的“高自主员工型”。

03、评分提示建议

例如“打分0-100，边界情况请单独说明”。

核心总结

① Prompt ≈ Code：要像写程序一样优化它。

②Evals胜于Prompt：质量测试胜过提示设计。

③创始人作为 FDE：最懂用户的人写最强Prompt。

④Metaprompting是Kaizen（持续改进）：使用 LLM 不断自我改进提示。

原提示的入门模板

“你是专家级提示工程师。请从歧义性、结构问题、遗漏边界情况三个角度评估以下提示，并重写为更可靠版本： [你的提示语]”

本文灵感来自 YC 的经典分享。未来的 AI 系统，不再是“堆算力”就能赢的游戏，而是“拼提示+拼评估+拼流程理解”的综合战场。提示工程师在白板前写公式的画面

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-10

终于用上了Google 的Antigravity，体验一把最新的Skills吧！

2026-02-10

MSE Nacos Prompt 管理：让 AI Agent 的核心配置真正可治理

2026-02-06

Claude Code Skill 开发完全指南：从入门到精通

2026-02-05

业务稳定造就大模型的降本增效？Claude 核心能力拆解（一）

2026-02-05

Prompt 的本质是“思维压缩包”：如何从结果中反推创作者的认知模型？

2026-02-04

Agent Skills 终极指南：从零到精通

2026-02-04

AI 原生研发范式：从“代码中心”到“文档驱动”的演进

2026-02-03

一文看懂现在最火的Agent Skills：自动化的提示词工程

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Gemini 3 提示词最佳实践指南

2025-11-20

别再问“怎么写 Skill.md”了，直接抄生产级的Skills 库

2026-01-04

一文带你看懂，火爆全网的Skills到底是个啥。

2026-01-13

关于智能体（AI Agent）最常用框架，做了超详细的总结！

2025-11-15

这个大师级Prompt，你一定要用起来

2025-11-15

Spec Kit 实践：从 Prompt 工程到规范驱动开发

2025-12-02

一份把 GPT-5.1 用到极致的实战提示词大全

2025-11-15

Prompt Engineering 最佳实践：一份全面的实战指南

2025-11-16

Cursor、CC、Codex 直接用！上下文工程 Agent Skills 来了，一周狂揽 4k Star

2026-01-10

永远不要自己写 Skill，除非你看完这一篇——深度拆解 Claude 官方 Skills [附清单下载]

2025-12-07

大家都在问

Prompt 的本质是“思维压缩包”：如何从结果中反推创作者的认知模型？

2026-02-05

Skills 真能取代 MCP 和 Prompts 吗？

2026-01-23

如何编写和部署Agent SKill？

2026-01-19

SDD 如何在复杂业务系统中真正落地？

2026-01-19

万物皆可 Prompt：AI 巨头们是在发明技术，还是在发明名词？

2026-01-15

别再把 Prompt 写死在代码里了：如何构建动态模板库？

2026-01-05

给你的 Agent 招个“前台”：如何用 Router 模式解决工具调用的混乱？

2025-12-30

如何评估与优化提示词？

2025-12-26

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean