微信扫码
添加专属顾问
我要投稿
Text-to-SQL总是失败?这个能自动学习的AI智能体,通过动态上下文和持续学习机制,彻底改变了传统模式! 核心内容: 1. Text-to-SQL智能体失败的根本原因分析 2. 动态上下文与持续学习的创新解决方案 3. 智能体自我提升的反馈循环机制
大家好,我是倔强青铜三。欢迎关注我,微信公众号:倔强青铜三。欢迎点赞、收藏、关注,一键三连!!!
本文将展示如何构建一个自我提升的 Text-to-SQL 智能体,它利用动态上下文和“穷人的持续学习”来回答问题。我们将问题分为两部分:
当智能体找到一个成功的结果时,它会将其存储在知识库中,供以后使用。这为 Text-to-SQL 智能体提供了一个自我提升的反馈循环,同时保持在线路径的稳定性。
大多数 Text-to-SQL 智能体在实践中失败,是因为它们每次从头开始,描述表、列、查找连接键。每次都会重复同样的错误。
相比之下,高级分析师或数据工程师不会每次都从头开始。他们会利用部落知识和经验,挖掘过去的查询以找到正确的查询。一旦找到有用的查询,他们就会将其保存在知识库中,供以后参考。我们的 Text-to-SQL 智能体也是如此。
我发现,大多数 Text-to-SQL 的失败并非“模型很蠢”,而是“模型缺少上下文和部落知识”的问题。让我们看看常见的错误:
你可以为 Text-to-SQL 智能体提供的最大改进是赋予它与人类工程师相同的部落知识。这使他们能够重用我们知道有效的查询,并在运行时让模型搜索已建立的使用模式。 称之为 RAG、智能体 RAG 或动态上下文,都是一样的:模型在运行时可以访问正确的上下文以生成正确的 SQL。
我们的目标很明确:
动态上下文就是:智能体在查询时检索相关的知识,这使它能够基于已建立的使用模式生成 SQL。上下文是动态的,因为它会根据查询、数据和用户的意图而变化。
智能体可以检索的例子包括:
如果你的知识库中有“每周活跃用户”的查询,你的智能体应该检索它,而不是重新发明它。
“穷人的持续学习”意味着:
每个好的查询都成为未来的上下文。 每个错误都成为一条规则。 每次澄清都成为共享知识。
穷人的持续学习之所以有效,是因为它提供了一个务实的学习循环:稳定的在线行为,受控的改进。最好的部分是,你总是可以手动探索知识库并修复问题或错误,想象一下手动更新模型权重。
系统分为两部分:
你可以对学习路径进行两项改进:
我们希望知识库存储三种信息:
TO_DATE 函数”)。我提供的示例代码库包含以下文件(表信息和常见查询):
agents/sql/knowledge/
├── constructors_championship.json
├── drivers_championship.json
├── fastest_laps.json
├── race_results.json
├── race_wins.json
└── common_queries.sql
我为我们的系统提供了一个生产就绪的工具,使用以下技术构建:
这里是 仓库(https://github.com/agno-agi/agentos-railway) 的链接,包含生产代码库。
以下是仓库的结构:
.
├── agents
│ ├── __init__.py
│ ├── sql
│ │ ├── __init__.py
│ │ ├── knowledge
│ │ ├── load_f1_data.py
│ │ ├── load_sql_knowledge.py
│ │ ├── sql_agent.py
│ │ └── test_questions.txt
│ └── ... more agents
├── app
│ ├── __init__.py
│ └── main.py
├── compose.yaml
├── db
│ └── ... database configuration
├── Dockerfile
├── pyproject.toml
├── railway.json
├── README.md
├── requirements.txt
├── scripts
│ ├── dev_setup.sh
│ ├── entrypoint.sh
│ ├── railway_up.sh
│ ├── format.sh
│ └── validate.sh
├── teams
│ └── finance_team.py
└── workflows
└── research_workflow.py
git clone https://github.com/agno-agi/agentos-railway.git
cd agentos-railway
我们将使用 OpenAI 作为 Text-to-SQL 智能体(我们还在服务中为其他智能体使用 Anthropic 和 Parallel Search)。请导出以下环境变量:
# 必需
export OPENAI_API_KEY="YOUR_API_KEY_HERE"
# 可选
export ANTHROPIC_API_KEY="YOUR_API_KEY_HERE"
export PARALLEL_API_KEY="YOUR_API_KEY_HERE"
你可以复制
example.env文件并将其重命名为.env以开始。
我们将使用 Docker 在本地运行应用程序并将其部署到 Railway。如果需要,请安装 Docker Desktop (https://www.docker.com/products/docker-desktop)。
使用 docker compose 运行应用程序:
docker compose up --build -d
此命令构建 Docker 镜像并启动应用程序:
localhost:5432 访问。启动后,你可以:
要加载 SQL 智能体的数据,请运行:
docker exec -it agentos-railway-agent-os-1 python -m agents.sql.load_f1_data
要填充知识库,请运行:
docker exec -it agentos-railway-agent-os-1 python -m agents.sql.load_sql_knowledge
http://localhost:8000 作为一个新的 AgentOS。你可以将其命名为 Local AgentOS(或你喜欢的任何名称)。演示视频地址:https://www.ashpreetbedi.com/videos/sql-agent-demo.mp4
这是一个 Text-to-SQL 智能体的演示。注意我如何将一个查询添加到知识库中,当再次提出相同的问题时,智能体使用它来生成 SQL。
完成后,使用以下命令停止应用程序:
docker compose down
要将应用程序部署到 Railway,请运行以下命令:
brew install railway
railway login
./scripts/railway_up.sh
此命令将:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-29
天猫超市数据AI实践总结
2025-12-28
利用AI Agent提升大模型Text-to-SQL能力应用实践
2025-12-27
【金猿案例展】中信百信银行——Data Agent智能指标项目
2025-12-26
AI Agent落地“卡壳”?腾讯云用100毫秒沙箱打通“最后一公里”|甲子光年
2025-12-26
都知道 AI 会重构组织,但为什么迈不出第一步?以及第一步从哪开始?
2025-12-24
企业AI应用落地的一些思考和记录
2025-12-24
打通任督二脉!当 Google NotebookLM 把这俩货焊在一起,我知道数据游戏规则变了
2025-12-24
如何让 BI 和 AI 用上同一份“好”数据?这份白皮书给你答案
2025-11-25
2025-10-23
2025-11-18
2025-12-05
2025-12-01
2025-10-14
2025-11-20
2025-11-10
2025-11-27
2025-11-29
2025-12-26
2025-12-21
2025-11-18
2025-11-13
2025-09-02
2025-08-16
2025-08-14
2025-08-06