支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


首款无限Agent Neo深度实测,出道两年半的AI转正了

发布日期:2025-05-21 05:42:35 浏览次数: 1548 作者:卡尔的AI沃茨
推荐语

首款无限Agent Neo深度实测,出道两年半的AI转正了。

核心内容:
1. Agent Neo的三大无限特质:无限步骤、无限上下文、无限工具
2. Neo在实际工作中的应用案例与表现:自动追踪全球AI动态、生成设计趋势网站等
3. 深度解析Neo的工作原理与能力,以及与其他AI Agent的对比

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

 AI不再相信人类 

关于 Agent

flowith 给出了自己的答案 ——

Neo

拥有了无限步骤无限上下文无限工具,Neo 完全可以通过过量的搜索和推理,不再盲目相信搜索结果,而是把最高质量的信息提供给大模型,让大模型生成最合适的提示语和上下文。

凌晨三点,我盯着屏幕上的 Neo,

任务还在跑,我甚至没动鼠标,

我的邮箱正安静地接收着第 17 轮自动报告,它正在抓取全球 AI 创业公司 CEO 们昨晚更新的 X 帖子,并根据我的口吻写两条新推文。

我之前试过太多 Agent。

有的能规划任务,但只能走五六步。

有的能生图,但中间思路完全看不到。

有的能联网搜索,但查出来的东西全是低质量内容。

Neo 身上的三个无限特质,第一次让我产生“我已经不是一个人在工作”的错觉。

怎么做才是无限呢?

Neo 的无限是,它可以在规定的时间内完成重复的复杂的任务,甚至可以以“年”为单位,只要我不主动终止任务且 token 额度充足,这个任务就可以一直重复、一直跑。

Neo 的无限还是,全自动输出100万字的内容,可以重写小说、电影甚至是电视剧结局,AI 能替代的角色又多了一位。

从我看or运行过的50+案例上看,Neo 除了基础的联网搜索、代码生成&运行,还可以完成邮件通知知识库融合看视频PPT生成浏览器使用等等使用场景的任务,而且质量很高。

我甚至感觉不出哪些是“人工输入”,哪些是“模型输出”,整个过程像是一个有主观能动性的数字生命在自己运转。

跟 Neo 第一次见面合影留念
跟 Neo 第一次见面合影留念

跑案例前,

flowith 还提供了 Neo 在通用 AI Agent 能力测试 GAIA 中的表现:在三个难度级别里都拿到了最高分:

Neo VS <a href=Manus VS OpenAI Deep Reserach" class="rich_pages wxw-img" data-ratio="0.5981481481481481" data-type="png" data-w="1080" style="display: block;margin: 0px auto;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);border-radius: 0px;object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;" data-imgfileid="100012110">
Neo VS Manus VS OpenAI Deep Reserach

接下来我会根据无限步骤无限上下文无限工具来深度拆借四个案例,以及额外盘点6个用例、flowith 的基础使用和这次 Neo 的邀请码们。


 01|无限步骤 

我给 Neo 下的第一个指令,

是帮我每天追踪全球的AI动态,

虽然维护自己的信息源已经快两年了,尝试过各平台特别关心,用过 RSS、信息聚合、三方订阅等等,但还是会漏掉一些信息。

所以这次的提示语难度相当高,

我是一名用户体验设计师,需要创建一个网站每天自动更新新的设计趋势和资源。

使用在线搜索工具,搜索X(Twitter)和Reddit等社交媒体上用户体验博客作者的最新动态和信息及资源。

网站每日更新一次,更新时间为美国东部时间18:00,持续更新一年。

完成输入后,Neo 开始了一场超长的“规划”动作,

先来看看它长到有点离谱的执行过程,

这些平行的块就是搜索过程,它们最终会汇总成一个完整的文本版日报。

成功运行第一次后,Neo就会将任务需求、时间、注意事项等固定下来,

而且改改需求会可以变成定时发送邮件,

我什么都没动。

Neo 自己选、自己写、自己配图、自己排版、自己发邮件。

限制 Neo 的只剩下钱包里的 Token 额度了。

这里值得额外提一嘴,

flowith 用的是无限画布的形式,

不同于 OpenAI Deep Research 一次性输出结果,中间节点的输出的过程都可以进行二次追问。

引用节点内容就是将文本作为模型输入
引用节点内容就是将文本作为模型输入


 02|无限上下文 

如果说以 OpenAI Deep Research 为代表,

Agent 擅长使用联网搜索收集多个信息源,通过推理模型筛选事实性信息,再整合输出研究报告。

Neo 就是在这个基础上再将能力放大两倍不止。

请在全网范围内搜索并了解《流浪地球》系列电影的背景和剧情,基于其世界观和故事线,创作《流浪地球3》的续集剧本,时长不少于两小时。每个关键剧情段落需配备相应的剧情概念图,并绘制完整的剧情发展脉络图。同时,为剧本中的关键场景和角色设计插图。开发一个支持多语言的网页平台,展示剧本内容、插图、角色介绍和剧情发展图,提供沉浸式的阅读体验。

一般 Agent 看到这个指令就挂了。

Neo 做到了什么?

一样是夸张的任务数量,

Neo 先是检索了《流浪地球》的背景、人物、主线,还找到了导演的采访信息,合理的推测出后续的剧本

这剧情,我有点入迷
这剧情,我有点入迷

给每个关键剧情、人物角色,甚至是宇宙现象都配了概念图,

每一张图都可以单独下载
每一张图都可以单独下载

然后开始生成网页,这一步非常像真人开发,先打一个能看全中英双语的粗网页,再优化UI、最后轮到交互动画。

这不是“响应式 AI”,这是“主动构建型智能体”。

它懂剧情节奏,懂结构逻辑,懂多模态联动,甚至还懂用户要什么样的体验。


 三、无限工具 

最后这一类我纠结了半天,

无限工具是指类似 600多个 MCP Servers 全封装进 Neo,

还是指 Neo 有自己的一套云端方案,理论上可以安装所有的已知工具。

都不是,

体验之后才发现真正无限的是 Agent,

在 Neo 里,Agent 可以主动给自己创建 Agent 来完成任务,无限套娃。

听起来有点拗口,我们结合案例来看看:

案例来自我的好朋友@倒放

很明显,这次是要考 Neo 生图能力,

因为我给的已经不是具体的提示语了,它会自主搜集信息、完成提示语编写和图片生成的所有步骤,

这里面它就创建了

搜索 Agent、生图 Agent、文档生成 Agent


还有一个我很喜欢的 case,看视频合集 & PPT制作

完整并深度观看视频(地址:【这里看的是40分钟的 MIT 线性方程教学】),输出针对初学者的教学计划、PPT幻灯片,附加练习和说明。

ppt制作的很全,而且也给出了相应的答案,当初我上大学的时候如果有这玩意,我不知道得是个多么开心的小孩。


 还有,

这些案例,量大管饱:

  1. 生成一份比较报告,收集并分析 Nvidia 和 AMD 消费级显卡自2005年以来的更新与迭代,重点关注技术特性和性能迭代幅度。
flo.host/tFRhc9Q/
flo.host/tFRhc9Q/
2.  重写权力的游戏第八季
flo.host/eBJp02r
flo.host/eBJp02r
3.  给《黑神话:悟空》做一个宣传网页
flo.host/69tglwV
flo.host/69tglwV
4. 以可视化的方式展示2022年至2025年5月人工智能领域重大投融资及并购事件。
5. 使用交互式网页生成最佳选座指南,看来Neo坐飞机也喜欢前排
flo.host/xiHoqI0/
flo.host/xiHoqI0/
6. 特斯拉Q1分析PPT


 也有惊喜!

使用方法很简单,

因为邀请码相当有限,在评论区留下你对 Neo 的看法或者是最想让 Neo 帮你做的一件事,我会随机抽取16个,

同时上面提到的所有案例都整理好了,公众号回复“neo”就可以获取。

来看看 flowith 的基础玩法吧,

? flowith.io

Agent 模式就是 Agent Neo,目前一天的对话次数是20次,一天快超过 OpenAI 一个月的量了。。。

flowith 集成的模型堪称豪华,gpt/o3/o4 mini、DeepSeek、claude、gemini、grok、glm、ideogram、flux、recraft、kling v1.6、veo2,可以满足基本对话联网搜索图片视频生成提示词生成,以及我使用频率最多的比较模式

flowith 本身还带知识库功能,让知识重新流动,

内置了365个知识库,

在对话开始的时候可以选择是否让模型读取知识库。


 写在最后 

我打心底佩服 flowith。

这群在硅谷+上海两地作战的年轻人,用不到一年时间,从 Agent Oracle 到 Neo,已经完成了我原以为五年都做不到的事情:

构建了一个真正有自我主张、有计划、有创作欲望的智能体。

flowith 从来不是做模型的,

他们做的是“AI如何变成你的工作搭档”。

Neo 就是一个现在进行时。

它已经在跑任务,在接工作,在接管我们过去每天需要10个app和3个同事的事情。

你可以说它是 Agent,也可以说它是原型 AGI。

但我更愿意说:它是未来人类工作结构的一个前哨。

我现在已经不再纠结“用哪个模型”。

我只想知道:这个 Agent 能不能在我不说话的时候,自己把事情做完。

Neo 能。

而且做得不差。

我非常清楚,它仍有很多不足:

一些任务复用时需要你重复解释 prompt

个别模型调用失败时会卡在流程里,

网页生成部分仍不够美观,需要设计师介入,

但我一点都不在乎。

因为这已经是我目前见过超像 AGI 的 Agent 了。

它能在你睡着时,帮你跑完 30 个流程;

能在你不回复时,继续重试并找方案;

能在你没说清楚时,主动给出预案和建议;

这就够了。

你可能现在还在犹豫要不要用 Agent。

但我建议你至少去试一次 Neo。

别再研究模型的推理方式、提示语写得如何复杂。

试着让 Neo 做一件你已经厌倦的事情,比如每天抓 AI动态,比如收集演讲视频并写结构化 PPT,比如写新闻分析。

然后你会发现:

有一天,你真的不需要动手,

一整套工作流,就被 AI 自动完成了。

工作变成了和 Neo 对话,而不是用手敲字。

这不就是我们曾经梦想的“AI时代”?

现在真的开始了。

欢迎来到未来。

欢迎加入Neo。


@ 作者 / 卡尔 @ 动手学AI知识库 / learnprompt.pro


最后,感谢你看到这里?如果喜欢这篇文章,不妨顺手给我们点赞?|在看?|转发?|评论?更多的内容正在不断填坑中……

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询