微信扫码
添加专属顾问
我要投稿
火山方舟闭门交流会独家分享:豆包大模型1.6升级实测,带来多模态处理能力的显著提升!核心内容:1. 豆包大模型1.6在多模态处理能力上的重大升级2. Viking知识库&向量库的技术突破与应用场景3. PromptPilot新功能体验与开发者福利彩蛋
不止Doubao-Seed-1.6-thinking的升级,豆包大模型团队还推出了最新全模态向量化模型:Seed1.6-Embedding。
这个全模态向量化模型有多强?大家可以看下面这张图:
在纯文本权威测评榜单 CMTEB 上,Seed1.6-Embedding 达到了中文 SOTA 效果。在多模态测评榜单 MMEB_v2 上,Seed1.6-embedding 在图片、视频任务上同样都达到了 SOTA 的效果,而且是断层领先。
Seed1.6-embedding 可以用在哪呢?举个例子大家就很清楚了:抖音的推荐系统。
在交流会上,火山官方提到,从2019年起,VikingDB 向量库就支撑起字节旗下包括抖音、头条、豆包等重要产品线。而 VikingDB 向量库背后,其实就是内嵌了一个 embedding 向量化模型。现在就是对应最新的 Seed1.6-embedding。
给大家展示下这个embedding有多强,比如我上传一张夏天的条纹t恤,然后让它帮忙找出类似风格,但是和秋天穿的长袖,他就能从一堆电商商品的图像库中快速锁定最符合的几个商品。
它最新还支持视频检索,这让我想起抖音会对用户上传视频的原创度进行提示,背后应该就是视频 embedding 模型发挥了重要作用。
不过需要注意的是,视频 embedding 模型还没有接入端到端的流程中,如果大家想要体验的话,可以尝试先向量化再入库的操作方式,部分操作和可视化体验将通过代码完成。据官方介绍,应该8月会有视频端到端的体验方案~
这正是我们在和AI协作中遇到的核心难题。即使掌握了提示词的核心原则,但在遇到真实问题时,我们还是很难快速给AI发出清晰、可靠的指令。
这就是 PromptPilot 诞生的重要原因。简单来说,它主要帮助我们完成两件“大事”:定义你的需求,持续不断优化。
第一件“大事”:在实践中,精准定义我们的真实意图
很多时候,在向AI提问的初期,我们自己也无法用几句话清晰地描述出脑海中完美的模型效果。我们对需求的理解,是在一次次尝试和调整中才逐渐清晰起来的。
PromptPilot 理解这一点,并提供了两种直观的方式来帮助你表达和固化你的真实意图:
1)评价与修改:
你可以先把你想到的直接发给PromptPilot,等PromptPilot给出回复后,再针对它给出的提示词进行局部评论优化,或者全局修改(如下图)。这就像在给模型“划重点”,告诉它你真正关心的是什么。
2)对比与偏好:
现实世界中,有很多高价值问题是没有标准答案的,更多时候需要你自己做出判断。
这时候你可以选择 PromptPilot 的 GSB 比较模式。通过“二选一”的方式,在两个或多个答案中选出你更偏爱的一个。PromptPilot 则会智能地分析你的每一次选择,比较不同答案之间的细微差异,从而“猜测”并学习你背后的判断逻辑,逐步构建起一个完整、清晰的评估标准。
当然,如果你已经有明确的理想回答,希望对模型回答进行评分。这时候就可以选择 PromptPilot 的评分模式。
第二件“大事”:上线后,开启永不疲倦的自动优化
当你通过上述方式建立了明确的评估标准后,PromptPilot 就可以开始自动为你寻找更优的 Prompt 版本了。
更酷的是,这一切并不会在应用上线后就停止。你可以通过调用 PromptPilot 的SDK,将线上业务的真实流量(模型的输入和输出)反馈给系统。
由于 PromptPilot 已经掌握了你的评判标准,它就像一位24小时在线的“AI裁判”,能够:
自动评分:对线上模型的表现进行实时打分。
案例挖掘:自动捕获并记录那些得分极低的“Badcase”和得分极高的“Goodcase”。
持续迭代:当积累了足够多的线上数据后,PromptPilot 就能开启新一轮的全自动提示词优化,找到能更好解决线上实际问题的升级版 Prompt。
最后,揭开在开篇提到的福利彩蛋 ~
在这次线下交流会,火山方舟发布了一个「协作奖励计划」,一方面是降低用户接入测试门槛,另外也是鼓励用户持续使用方舟。
只要你是火山的企业认证用户和个人认证用户,在活动期间,每天都可以获得一定量的免费tokens。企业认证用户每天每个模型 500 万 tokens,个人认证用户每天每个 50 万 tokens。
如果大家平时有调用需求的话,可以进入授权页参与计划,领首月免费包 :https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement?LLM=%7B%7D&OpenAuthorizeModal=true&OpenTokenDrawer=false
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-08-02
大模型时代的AI Infra内容浅析与趋势思考
2025-08-02
阿里Qwen-MT翻译模型发布: 挑战GPT-4.1,专业术语、领域风格精准拿捏!
2025-08-02
AI开发者必看:深度解析MCP,打造高效LLM应用的秘密武器!
2025-08-02
【深度】企业 AI 落地实践(四):如何构建端到端的 AI 应用观测体系
2025-08-02
Ollama vs vLLM:哪个框架更适合推理?(第二部分)
2025-08-02
刚刚,Anthropic切断OpenAI对Claude的访问权限
2025-08-02
金融大模型的“垂直突围”:蚂蚁数科打造更懂金融的行业大脑
2025-08-02
一个人干掉整个技术部
2025-05-29
2025-05-23
2025-06-01
2025-05-07
2025-05-07
2025-05-07
2025-06-07
2025-06-21
2025-06-12
2025-05-20
2025-08-02
2025-08-02
2025-07-31
2025-07-31
2025-07-31
2025-07-30
2025-07-30
2025-07-30