微信扫码
添加专属顾问
我要投稿
Embedding模型选型不再只看相似度,2025年最新技术帮你平衡精度与成本! 核心内容: 1. 传统选型指标的局限性及RAG系统的新需求 2. LLM-based Embedding架构变革与套娃表示学习技术 3. 主流开源模型梯队划分及实战选型建议
之前我分享过一篇文章,也是Embedding模型选型,一年过去了,这个领域变化也比较大。
Embedding模型选型思路:决定知识库与RAG的准确率上限!
以前我们选择 Embedding 模型往往只看一个指标:MTEB(Massive Text Embedding Benchmark)综合得分。
但今年随着 RAG系统的普及,工业界对 Embedding 的要求已经从单一的“语义相似度”演变为对 “检索正确性(Correctness)”、“推理延迟(Latency)”以及“多模态/多语言能力”的多维考量。
例如,Cosine Similarity 高不代表检索正确。
在 RAG 中,如果用户问“推荐一款适合肠胃的益生菌”,模型检索到了“益生菌对肠胃不好”的文章(语义高度相关,但事实相反),这肯定有问题。
本文将结合最新的 AIMultiple 2025 Benchmark 以及 MTEB 2025 榜单,深入剖析当前主流的开源 Embedding 模型,为你提供一份面向生产环境的选型指南。
在进行选型之前,我们先看下 2025 年 Embedding 模型的底层架构发生了哪些关键变化。
从 BERT 到 LLM-based Embedding:
传统的 Embedding 模型(如 BERT, RoBERTa)通常采用 Bi-Encoder 架构,参数量在 100M-300M 之间。
今年LLM-based Embedding(如 NV-Embed-v2, Qwen3-Embedding)成为了“屠榜”的主力。这类模型直接使用 Decoder-only 的 LLM(参数量 7B+)作为基座,通过指令微调(Instruction Tuning)生成向量。
套娃表示学习 (Matryoshka Representation Learning, MRL):
这是 2025 年最实用的技术创新之一(如 Nomic-Embed-v1.5, OpenAI text-embedding-3)。
原理:训练时强制模型的前 维(如前 64, 128, 256 维)也能包含足够的信息。
数学表达:
损失函数不再仅针对全维度 ,而是对一组嵌套维度集合 求和:
这类模型允许你在向量数据库中仅存储前 256 维以节省 75% 的存储和检索开销,而在重排序(Rerank)阶段使用全维度,实现了成本与精度的完美平衡。
基于 AIMultiple 的最新评测(针对 RAG 场景的正确性测试)和 MTEB 数据,我们将模型分为三个梯队。
令人惊讶的是,在 2025 年的 AIMultiple 评测中,e5-small (118M 参数) 在特定 RAG 场景(Amazon 产品检索)中击败了许多 7B 级别的模型。
BAAI(智源)发布的 bge-m3 依然是 2025 年最通用的选择。
如果你不仅需要“找到”文档,还需要模型“理解”复杂的指令,这两个模型是目前的 SOTA(State of the Art)。
| 高并发 RAG / 电商搜索 | |||
| 混合语言 / 全球化业务 | |||
| 复杂知识库 / 法律金融 | |||
| 成本敏感 / 向量库巨大 | |||
| 边缘端 / 本地部署 |
以上都是AIMultiple 2025年的Embedding模型榜单集合,大家具体到自己的业务,参考看看哪个Embedding模型最合适。
我们也可以结合 AIMultiple 的 Benchmark 数据,得出以下比较反直觉的结论:
e5-small (118M) 在产品级检索任务中,Top-5 正确率(100%)完胜 Qwen3-0.6b (595M, 47%)。在垂直领域,针对性训练的小模型远胜通用大模型。历史文章:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-06
Palantir Ontology 助力AIP Agent落地工具介绍:Object Query
2025-12-05
亚马逊Agent克服遗忘的“秘诀”,被中国团队掌握,让大模型遗忘率趋近于0
2025-12-05
把AI记忆做好,是一个价值6千亿美元的市场
2025-12-05
我错了,RAG还没完!AI记忆的结合会成为下一个技术风口
2025-12-04
搜索的终极形态?向量搜索重构信息检索范式
2025-12-04
RAG 深度解读:检索增强生成如何改变人工智能
2025-12-03
大模型RAG入门宝典|从AI搜索到实战搭建,小白&程序员必收藏的检索增强指南
2025-12-03
货拉拉RAG优化实践:从原始数据到高质量知识库
2025-09-15
2025-09-08
2025-09-10
2025-09-10
2025-10-04
2025-10-11
2025-09-30
2025-10-12
2025-11-04
2025-09-12
2025-11-23
2025-11-20
2025-11-19
2025-11-04
2025-10-04
2025-09-30
2025-09-10
2025-09-10