微信扫码
添加专属顾问
我要投稿
深入解析AI行业的最新动态,探索LLM、MCP和Agent技术的实际应用。 核心内容: 1. RAG技术详解及其在增强语言模型中的应用 2. MCP模型上下文协议的介绍与标准化工具调用机制 3. 基于LLM技术构建的智能体项目实践案例分享
1、RAG是什么
2、RAG旨在解决生成式语言模型的一些缺陷
1、MCP是什么
2、为什么要提出MCP
3、原理和质疑
之前的认知是大模型的生成过程是个黑箱or概率模型,llm只是在无情地按概率预测下一个token。Anthropic团队的AI可解释性研究提出了一些新观点(Circuit Tracing[5]、AI Biology[6]、summary[7]),大模型的内部世界可能非常反直觉。梳理完之后有两个收获:一是更新了这部分认知,二是对写prompt很有帮助。
此前Manus自封全球首款通用型AI Agent,掀起一大波热度,邀请码一度被炒到上万元一个。最近字节发布自家的AI Agent——扣子空间,申请即可试用,终于在2025年真实体验到了早在一两年前各家宣传视频上就有的演示效果。
先来看看扣子空间的运行界面:左边是传统对话界面,会显示思考过程、正在执行的任务和输出;右边有实时跟随、文件、终端,终端=ai的"虚拟机",ai可以在终端里面部署环境和工具、执行代码并输出结果、创建和读写文件。过去AI只有嘴,现在终于有手了。
下面是我跑的一些任务实例,测试一下Agent这种产品形态跟日常用的各家llm产品相比,有哪些不一样的体验。
输入如下:
基于《百年孤独》,创建一个读书笔记网页,实现以下功能:
页面1:介绍书中主要人物、重要情节;
页面2:从书中摘录出文学性较强的片段,附上注解、配图,形成多篇读书笔记;
页面3:页面3用户能与主要人物进行对话;
页面4:附上相关的文学评论或研究。
其他页面:发挥你天马行空的创意,自行生成。
Agent依次执行了:pdftotext、llm结合用户输入提取txt关键信息、gen_image、设计网页UI、生成网页代码、部署网页。一套流程行云流水,给出了下面的网页[8]:
网页框架完整,有基本的UI和动效。对于这类任务,coze直接给出了jsx文件和网址(部署在coze服务器上),帮用户省去了部署并发布网址的操作。
用了内置的“专家agent”华泰A股观察助手。只输入了一句“分析安克创新这只票”,然后执行了一系列非常标准化的任务,创建了一堆csv、py、md文件。
生成的结果如下[9],也是以网页的形式给出。内容上和其他llm产品没有很大区别,形式上直接给出网址,高效一些。
喂了一个写有量化金融题目描述、公式描述和函数示例的ipynb文件,让Agent推导公式、生成代码写入ipynb、执行并输出pdf via latex。
截止到运行代码,跟其他llm产品区别不大。但比较惊喜的是,agent自己安装好了导出tex文件所需的依赖包,成功执行代码并导出了latex-pdf文件。安装依赖和执行的过程不完全顺风顺水,输入几次“继续”之后agent自己搜索网络成功debug。这应该是目前非agent产品做不到的。
综上,整体感受是,通用Agent在一些边际工作上带来了一定程度的效率提升,但暂时达不到刚需。
用字节coze和腾讯元器平台搭了一些简单的智能体:两个对话游戏、一个url转播客工具、一个公众号后台回复bot。
游戏玩法:初始元素有?水、?火、?土,选两个元素输入,ai随机生成新物质并放入元素列表。通过不断的自由组合,生成五花八门的各种元素,并随机触发成就事件。
我的搭建流程:
用法:输入文章链接,生成男女主播对话形式的音频文件,并加入合适的bgm。可以在链接前加上“音量num+”来调整bgm音量大小。
整个智能体通过对话流agent实现:读取url、llm1生成播客台词、合成语音、llm2生成bgm关键词、选取bgm、合成音频文件。
用我之前的旅行攻略文章测试,效果不错。之前用扣子空间测试了几次,都生成失败,目前一些定制化需求还是手搓工作流实现起来更稳健一些。
coze平台有很多类似的智能体。我用之前写的另一篇关于LLM制作文字冒险游戏的文章测试url转相声,效果也不错:
游戏玩法:输入任何事物名称,都能回复一个消费降级的平替。
和元素合成游戏一样,通过纯prompt实现。
在腾讯元器平台上搭的工作流,实现公众号后台多功能对话。
目前只写了正常对话+游戏调用:若正常对话就调用llm1,若想进行游戏就调用llm2。两个llm对应不同prompt。
与coze相比,腾讯元器的工作流编辑操作体验一言难尽。不过此前微信开了公众号智能回复灰度测试,以后应该会继续迭代。
综上,上述智能体已放公众号后台菜单"My GPTs",目前有coze免费额度,欢迎来试用。
多年以后,当我站在AGI时代的光晕中,或许会想起自己手搓工作流、搭建智能体的那个遥远的下午。那时的我,或许已记不清RAG与MCP的细枝末节,但那些与AI共同探索的瞬间,如同布恩迪亚家族对冰块的执念,早已成为某种意义上的启示录——毕竟,真正改变世界的从不是技术本身,而是我们如何用代码、协议与想象力,在概率的迷雾中雕刻出属于人类的答案。???
感谢阅读!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-09
OpenAI升级AI编码能力!深度研究代理打通GitHub,Codex支持智能体循环分析改进
2025-05-09
解密NVIDIA团队的代理式AI技术实践
2025-05-09
Cursor创始人深度访谈:AI 如何重塑编程的未来与实践
2025-05-09
ChatGPT降智最佳实践研究
2025-05-09
大模型人工智能Agent到底是什么,一文搞懂智能体相关概念及原理
2025-05-09
【深度】如何通过MCP实现多智能体之间的协同
2025-05-09
【Cursor实战】Cursor+两个MCP复刻一个简单的Manus
2025-05-09
一口气讲清楚:AI Agent发展史
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-05-09
2025-05-08
2025-05-07
2025-04-30
2025-04-29
2025-04-29
2025-04-29
2025-04-28