支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


受邀参加火山方舟闭门交流会,我给大家带回了这些实测分享

发布日期:2025-08-01 12:49:56 浏览次数: 1527
作者:ai呀蔡蔡

微信搜一搜,关注“ai呀蔡蔡”

推荐语

火山方舟闭门交流会独家分享:豆包大模型1.6升级实测,带来多模态处理能力的显著提升!

核心内容:
1. 豆包大模型1.6在多模态处理能力上的重大升级
2. Viking知识库&向量库的技术突破与应用场景
3. PromptPilot新功能体验与开发者福利彩蛋

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家
Agents,以及一切感兴趣的AI新鲜事 ~ 我优先考虑自己的好奇心,而不是别人的需求。作品:《Curosr从小白到专家》系列视频、《DeepSeek自学手册》" data-id="MzIyMzk3MTEwNQ==" data-is_biz_ban="0" data-service_type="1" data-verify_status="0">
周三参加了火山方舟的闭门交流会,还挺有意思的,大家一边交流一边体验新产品功能。火山的人非常听劝,好的想法都会采纳,并且都会给到你一个大致的时间点去落地。
而且万万没想到,自己还成了其中提交反馈数最多和高质量反馈数最多的开发者之一。
回到这次闭门交流会的新产品新功能上,自己体验下来印象比较深的有三个,分别是再次升级的豆包大模型1.6,Viking知识库&向量库,以及PromptPilot。

悄悄告诉大家:文末有个福利彩蛋 ~


豆包大模型1.6能力升级:多模态处理能力更强

先给大家看个网站复刻的case:

之所以选择网站复刻,因为这同时考验模型的视觉理解和前端Coding能力,一方面看模型的视觉理解能捕捉到多少细节,另外就是看模型将捕捉到的细节能还原到什么程度。

下面这张YouTube截图我同时给到了升级前后的两个豆包大模型1.6。


这是用Doubao-Seed-1.6-thinking-0615复刻后的YouTube网站,大家会发现,左侧边栏菜单这个布局细节是完全被忽略的。


反观Doubao-Seed-1.6-thinking-0715的复刻,还原得非常好,左侧边栏菜单几乎完美复刻了,包括所有的图标。这是因为0715版本的模型拥有更强的推理分析能力,尽管耗时更久(146秒对比41秒),但给出的结果满意度显然也更高。


这就是Doubao-Seed-1.6-thinking-0715模型,思考能力大幅强化,对比之前的0615模型,在Coding、Math、逻辑推理等基础能力上进一步提升,支持视觉理解。支持 256k 上下文窗口,输出长度支持最大 16k tokens。


大家现在就可以在火山方舟的体验中心尝鲜:https://www.volcengine.com/experience/ark?model=doubao-seed-1-6-thinking-250715。

火山方舟为了让大家尝鲜更尽兴,每个模型还赠送50万tokens推理额度。没错,是这里已有的每个模型,都有50万tokens。


不止Doubao-Seed-1.6-thinking的升级,豆包大模型团队还推出了最新全模态向量化模型:Seed1.6-Embedding


这个全模态向量化模型有多强?大家可以看下面这张图:


在纯文本权威测评榜单 CMTEB 上,Seed1.6-Embedding 达到了中文 SOTA 效果。在多模态测评榜单 MMEB_v2 上,Seed1.6-embedding 在图片、视频任务上同样都达到了 SOTA 的效果,而且是断层领先。



Seed1.6-embedding 可以用在哪呢?举个例子大家就很清楚了:抖音的推荐系统。


在交流会上,火山官方提到,从2019年起,VikingDB 向量库就支撑起字节旗下包括抖音、头条、豆包等重要产品线。而 VikingDB 向量库背后,其实就是内嵌了一个 embedding 向量化模型。现在就是对应最新的 Seed1.6-embedding。



给大家展示下这个embedding有多强,比如我上传一张夏天的条纹t恤,然后让它帮忙找出类似风格,但是和秋天穿的长袖,他就能从一堆电商商品的图像库中快速锁定最符合的几个商品。



它最新还支持视频检索,这让我想起抖音会对用户上传视频的原创度进行提示,背后应该就是视频 embedding 模型发挥重要作用。


不过需要注意的是,视频 embedding 模型还没有接入端到端的流程中,如果大家想要体验的话,可以尝试先向量化再入库的操作方式,部分操作和可视化体验将通过代码完成。据官方介绍,应该8月会有视频端到端的体验方案~



PromptPilot再升级:更轻松提出一个好问题
在6月份的时候,我其实有简单介绍过PromptPilot>>>豆包1.6模型编程能力上来了!轻松开发Bento Grid网页(附全流程演示),没想才过去一个月,PromptPilot又升级了。
在正式介绍PromptPilot,我先绕个弯,和大家分享今天看到的一个观点,来自极客公园CEO张鹏,这里摘录部分:
“AI时代,产品的基本构型就是两端分别是input和output,中间的AI则是个Magic  Box。大模型的确有 Magic,但问题也在于,它是一个处于失控状态的不确定的概率模型。因此,产品的目标之一就是在不确定性中增加确定性。
对于大多不自主研发大模型这个「Magic Box」的团队而言,就要在 input 和 output 这两端上下功夫 …… Karpathy 和 Grove 提出的「上下文工程」和「规范化编程」,也是在 input 上做加强。
.....
这两条路径都远超了「一次性」的提示词或提示词工程。提示词的困境在于,它把人怼到了一个死角里,它默认「人」是那个清晰、可靠的指令发出方。可现实是,别说普通用户,就算是 CEO,有几个能一上来就把自己的愿景、使命、产品逻辑结构化、无歧义地拆解清楚?又有几个老板能在每次发号施令的时候,把上下文、意图、原则、规范等等都清晰明了地传达?寥寥无几。”

这正是我们在和AI协作中遇到的核心难题。即使掌握了提示词的核心原则,但在遇到真实问题时,我们还是很难快速给AI发出清晰、可靠的指令。

这就是 PromptPilot 诞生的重要原因。简单来说,它主要帮助我们完成两件“大事”:定义你的需求,持续不断优化。

第一件“大事”:在实践中,精准定义我们的真实意图

很多时候,在向AI提问的初期,我们自己也无法用几句话清晰地描述出脑海中完美的模型效果。我们对需求的理解,是在一次次尝试和调整中才逐渐清晰起来的。

PromptPilot 理解这一点,并提供了两种直观的方式来帮助你表达和固化你的真实意图:

1)评价与修改

你可以先把你想到的直接发给PromptPilot,等PromptPilot给出回复后,再针对它给出的提示词进行局部评论优化,或者全局修改(如下图)。这就像在给模型“划重点”,告诉它你真正关心的是什么。

2)对比与偏好:

现实世界中,有很多高价值问题是没有标准答案的,更多时候需要你自己做出判断。

这时候你可以选择 PromptPilot 的 GSB 比较模式。通过“二选一”的方式,在两个或多个答案中选出你更偏爱的一个。PromptPilot 则会智能地分析你的每一次选择,比较不同答案之间的细微差异,从而“猜测”并学习你背后的判断逻辑,逐步构建起一个完整、清晰的评估标准。

当然,如果你已经有明确的理想回答,希望对模型回答进行评分。这时候就可以选择 PromptPilot 的评分模式。

支持“用户打分”和“AI智能评分”。在“AI智能评分”中,首先需明确评分标准。支持“用户输入评分标准”与“AI生成评分标准”两种方式。


第二件“大事”:上线后,开启永不疲倦的自动优化

当你通过上述方式建立了明确的评估标准后,PromptPilot 就可以开始自动为你寻找更优的 Prompt 版本了。

更酷的是,这一切并不会在应用上线后就停止。你可以通过调用 PromptPilot 的SDK,将线上业务的真实流量(模型的输入和输出)反馈给系统。

由于 PromptPilot 已经掌握了你的评判标准,它就像一位24小时在线的“AI裁判”,能够:

  • 自动评分:对线上模型的表现进行实时打分。

  • 案例挖掘:自动捕获并记录那些得分极低的“Badcase”和得分极高的“Goodcase”。

  • 持续迭代:当积累了足够多的线上数据后,PromptPilot 就能开启新一轮的全自动提示词优化,找到能更好解决线上实际问题的升级版 Prompt。


这可比自己吭哧吭哧进行模糊又低效的提问方便多了。都说好的回答都缺少一个好的问题,那么 PromptPilot 做的就是,让我们更轻松地提出一个好问题
不仅如此,为了帮助我们在垂直领域提出更专业的好问题,PromptPilot 这次升级还上线了知识库功能,支持我们上传自己所在领域的专业知识库。
后续进行提示词优化时,我们只需要勾选上这个知识库,
就可以帮助模型精准调用专业内容,以更深入、更精准、更可信的理解与输出,真正为解决复杂业务中的“专业难题”。
这次交流会还集中体验了火山的Responses API(专门用来构建Agent的API)、AI知识管理,这里就不一一介绍,大家感兴趣的话可以自行体验。


最后,揭开在开篇提到的福利彩蛋 ~


在这次线下交流会,火山方舟发布了一个「协作奖励计划」,一方面是降低用户接入测试门槛,另外也是鼓励用户持续使用方舟。

只要你是火山的企业认证用户和个人认证用户,在活动期间,每天都可以获得一定量的免费tokens。企业认证用户每天每个模型 500 万 tokens,个人认证用户每天每个 50 万 tokens。

如果大家平时有调用需求的话,可以进入授权页参与计划,领首月免费包 :https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement?LLM=%7B%7D&OpenAuthorizeModal=true&OpenTokenDrawer=false

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询