微信扫码
添加专属顾问
我要投稿
探索Qwen3-Embedding模型的多维度优势和应用场景。核心内容:1. Embedding模型选择的标准与评估基准MTEB2. Qwen3-Embedding模型的核心能力解析3. Qwen3-Embedding模型的亮点与应用场景分析
字数 991,阅读大约需 5 分钟
rag的时候,Embedding如何选,一般情况都是能力+成本的综合评估,我一般选择,看排行榜(重点关注的哪项能力),然后再看部署成本。一般看mteb的评估即可。
https://huggingface.co/spaces/mteb/leaderboard
这是目前最权威、最广泛使用的 embedding 评估基准,由 Hugging Face 和一批研究人员发起,旨在全面衡量嵌入模型在不同下游任务中的泛化能力。包含 8 大类、58 个任务。具体的分类和任务我们不做讨论。
我们看下embedding 模型应当具备的能力
在qwen3-Embedding 0.6b没有出来之前,同规格下,bge-m3还是不错的。
我把表格数据下载下来,丢给chatgpt,让它综合评估了下。
Qwen3 Eembedding基于 Qwen3 系列的密集基础模型,所以它天然的继承了qwen3的多语言能力、长文本理解和推理能力。它提供了各种大小(0.6B、4B 和 8B)的全面文本嵌入和重新排序模型。
灵活定义向量
,并且嵌入和重排序模型都支持用户定义的指令,以增强特定任务、语言或场景的性能。
• MRL 支持
表示嵌入模型是否支持自定义最终嵌入的维度。
指令感知
表示嵌入或重排序模型是否支持根据不同任务定制输入指令。通过数据可以看到Qwen3-embedding模型上下文长度为32k,嵌入维度可以灵活自定义。
FROM ./Qwen3-Embedding-0.6B-f16.gguf
PARAMETER num_ctx 32768
TEMPLATE """{{ .Prompt }}"""
SYSTEM """Text embedding model. Outputs a vector based on input text."""
curl http://127.0.0.1:11434/api/embeddings -d "{\"model\": \"qwen3-embedding:0.6b\", \"prompt\": \"你好,世界\", \"options\": {\"embedding_dim\": 256}}"
至于效果,后续实际测试下
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-08
一篇文章说清楚AI三大核心技术:RAG、大模型、智能体
2025-06-08
错过这个框架,80%老板正在浪费AI投资
2025-06-08
Cursor 1.0 深度解析:它和 Windsurf,谁才是开发者的下一个“AI同事”?
2025-06-08
关于AI Agent产品管理的一些思考
2025-06-08
AI PC新突破 端侧首次支持128K上下文窗口 实现2.2倍推理优化
2025-06-08
读完ChatGPT o3最新的三万字系统提示词,我发现AI正在进化为真正的智能体
2025-06-07
从基础开始,先理解 AI 是什么(上篇)
2025-06-07
AI术语入门(下篇):Prompt、Agent、Langchain,下一站的AI地图
2024-08-13
2024-06-13
2024-08-21
2024-07-31
2024-09-23
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-07-20
2025-06-08
2025-06-07
2025-06-05
2025-06-04
2025-06-04
2025-06-03
2025-06-02
2025-05-31