我要投稿

如何看待qwen3-Embedding模型

发布日期：2025-06-08 07:55:53 浏览次数： 2250

作者：5ycode

微信搜一搜，关注“5ycode”

这是目前最权威、最广泛使用的 embedding 评估基准，由 Hugging Face 和一批研究人员发起，旨在全面衡量嵌入模型在不同下游任务中的泛化能力。包含 8 大类、58 个任务。具体的分类和任务我们不做讨论。

我们看下embedding 模型应当具备的能力

能力	相关任务	对应意义
语义表征能力	STS、分类	是否能准确理解句子含义
检索能力	检索、Rerank	是否能找到语义上相似的句子
多语言泛化能力	跨语言检索	不同语言之间语义是否对齐，英文搜索中文
聚类/结构能力	Clustering	embedding 空间是否语义组织良好
迁移泛化能力	MTEB 全面任务	是否在多个任务/数据集上都有效

在qwen3-Embedding 0.6b没有出来之前，同规格下，bge-m3还是不错的。

我把表格数据下载下来，丢给chatgpt，让它综合评估了下。

BGE-m3 适用场景和不推荐使用场景

Qwen3 Eembedding亮点

Qwen3 Eembedding基于 Qwen3 系列的密集基础模型，所以它天然的继承了qwen3的多语言能力、长文本理解和推理能力。它提供了各种大小（0.6B、4B 和 8B）的全面文本嵌入和重新排序模型。

• 卓越的多功能性：嵌入模型在广泛的下游应用评估中取得了最先进的性能。8B 大小的嵌入模型在 MTEB 多语言排行榜上排名第 1（截至2025年6月5日，得分为 70.58），而重排序模型在各种文本检索场景中表现出色。
• 全面的灵活性：Qwen3 Embedding 系列为嵌入和重排序模型提供了从 0.6B 到 8B 的全尺寸范围，适用于重视效率和效果的各种使用场景。开发者可以无缝地结合这两个模块。此外，嵌入模型允许在所有维度上灵活定义向量，并且嵌入和重排序模型都支持用户定义的指令，以增强特定任务、语言或场景的性能。
• 多语言能力：得益于 Qwen3 模型的多语言能力，Qwen3 Embedding 系列支持超过 100 种语言。这包括各种编程语言，并提供了强大的多语言、跨语言和代码检索能力。

• MRL 支持 表示嵌入模型是否支持自定义最终嵌入的维度。

• 指令感知 表示嵌入或重排序模型是否支持根据不同任务定制输入指令。

通过数据可以看到Qwen3-embedding模型上下文长度为32k，嵌入维度可以灵活自定义。

我也让chatgpt基于mteb评测数据综合评估下qwen3-Embedding

不管是通过官方的介绍，还是chatgpt、DeepSeek通过评测数据，qwen3-embedding确实强。怎么选？

部署

Ollama上还没有这个模型，怎么部署？

在魔塔社区，有对应的GGUF模型。

根据自己的需求选一个即可，我选1.2GB大小的模型。

然后创建一个Modelfile，内容如下

FROM ./Qwen3-Embedding-0.6B-f16.gguf  

PARAMETER num_ctx 32768 
TEMPLATE """{{ .Prompt }}"""  
SYSTEM """Text embedding model. Outputs a vector based on input text."""

curl http://127.0.0.1:11434/api/embeddings -d "{\"model\": \"qwen3-embedding:0.6b\", \"prompt\": \"你好，世界\", \"options\": {\"embedding_dim\": 256}}"

至于效果，后续实际测试下

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-03-07

GPT5.4回一个hi要花80刀，OpenAI应该看看谷歌这篇新论文了｜Hao好聊论文

2026-03-07

你花真金白银买的第三方API，有一半都是假的

2026-03-07

Xiaomi miclaw，小米移动端 Agent 开启小范围封测

2026-03-07

GPT-5.4 深度评测报告

2026-03-06

GPT-5.4「原生操控电脑」实测封神！OpenClaw天选模型来了

2026-03-06

刚刚！小米手机可以养小龙虾🦞了

2026-03-06

GPT-5.4实测全记录，当我让它操控我的电脑微信...

2026-03-06

GPT-5.4发布，AI的最强之争已经结束了！

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Pencil：设计和写代码，以后就全让AI干了

2026-01-24

独家实录｜唐杰、杨植麟、林俊旸、姚顺雨...All Star 对话上，大家聊了啥？

2026-01-10

2026 开年 AI 工具推荐，让你新的一年效率起飞！（建议收藏）

2026-01-01

从0到1玩转Clawdbot：我花了40小时，把这些坑都踩完了

2026-01-26

Codex 史诗级更新！引入 Skills 技能库，直接兼容 Claude 生态，开发效率原地起飞

2025-12-09

Claude赢麻了？OpenAI Codex正式支持Skills，GitHub连夜上车！

2025-12-21

终于！Gemini CLI支持Agent Skills，一键搬运Claude Code的“绝招”

2026-01-09

Claude Code Skills 国内实践全指南：从安装部署到高阶开发

2026-01-09

谷歌没想到：Antigravity 竟成了 Claude Code 的“免费充电宝”？

2025-12-30

从安装到运行：手把手教你用Clawdbot完成第一个智能任务

2026-01-27

大家都在问

马斯克大赞阿里 AI，9B 参数硬刚 120B，海外网友：这叫小模型？

2026-03-03

Claude Code 的记忆机制：从CLAUDE.md到Auto Memory，它到底记住了什么？

2026-03-01

AGENTS.md 真的能帮助编码智能体吗？

2026-02-27

谷歌 Nano Banana 2 凌晨突袭！生图速度飙升，价格直接腰斩，Pro 功能竟然也免费了？

2026-02-27

Claude Code Security 的发布，会如何重塑传统网络安全企业？

2026-02-26

当软件不值钱了以后，最稀缺的资源是什么？

2026-02-24

AI Agent系列｜什么是 ReAct Agent？

2026-02-24

一切皆可Agent Skills，无处不在的AI Agent会替代业务流程吗？

2026-02-14

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw