我要投稿

开源嵌入新王落地！Qwen3-Embedding 本地部署指南 + Dify 召回测试实录

发布日期：2025-06-08 15:29:43 浏览次数： 4297

作者：AISpace研习所

微信搜一搜，关注“AISpace研习所”

前两天，通义千问推出的 Qwen3-Embedding 系列模型（包括8B、4B和0.6B三个版本）在权威评测中表现惊艳，尤其在多语言任务和长上下文处理能力上全面超越主流竞品，成为开源嵌入模型的新王者。

多尺寸全能选手，全面碾压BGE-M3！

性能霸榜，全尺寸领先

Qwen3-8B以70.58总分登顶榜单（超越Gemini-001的68.37），在16项评测中12项第一，尤其在检索精度（MSMARCO 57.65）、问答能力（NQ 10.06）等关键任务上表现惊艳。

即使最小尺寸的Qwen3-0.6B（仅595M参数），总分64.34仍显著超越7B级竞品（如SFR-Mistral 60.9），小模型也有大能量！

对比BGE-M3：全方位代差优势

指标	Qwen3-8B	BGE-M3	优势幅度
综合得分	70.58	59.56	↑11.02
上下文长度	32K	8K	↑ 4倍
检索任务(MSMARCO)	57.65	40.88	↑41%
开放问答(NQ)	10.06	-3.11	实现负分逆转
多语言理解	28.66	20.10	↑42%

Qwen3在保持99%榜单合规性的同时，以更高维度参数（8B vs 568M）和4倍上下文支持，彻底改写Embedding模型性能边界！

同尺寸模型对比：性能碾压同级

同为7B级别：Qwen3-8B对比Linq-Embed-Mistral（61.47）、SFR-Mistral（60.9），性能领先超15%。

轻量级战场：Qwen3-0.6B（64.34）大幅领先同类小模型如multilingual-e5-large（63.22）、BGE-M3（59.56），证明通义千问架构的高效性。

本地部署Qwen3-Embedding

GPUStack本地部署

根据官方文档自行部署GPUStack，官方提供了Docker镜像，可快速部署。

在GPUStack的模型界面，点击 部署模型 -> ModelScope，搜索qwen3-embedding。平台会自动检测你的硬件性能，推荐可以安装的量化模型版本。

我们选择了 qwen3-embedding-8b的Q8_0量化版本，等待模型下载，提示 running，表示模型已经部署完成。

dify中测试

现在Dify的插件市场中找到GPUStack，点击安装插件。等插件安装完成后，进行模型配置。

创建知识库，在Embedding模型中，选择我们自己部署的模型。

把公众号的历史文章，放入知识库进行测试。

选择Dify的父子分段策略。由于是markdown格式，希望每一个大段为一个父块，分段符选择 “#”.

测试一下召回情况

（完）

关注公众号获取更多精彩内容

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-01-27

Clawdbot 完整安装教学：2026 年最火的开源AI 个人助理

2026-01-27

实测Kimi K2.5，这是一款厌丑的开源模型

2026-01-27

Office 是 2026 Agent 的主战场｜Kimi K2.5 开源，Agent 先下一城

2026-01-27

Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

2026-01-26

Clawdbot 的真正创新是网关：一篇了解架构、权限和风险

2026-01-26

MiniMax M2.1 × Clawdbot ：打造开源 AI 助手，构建超级智能体工作流

2026-01-26

还得是腾讯，Claude Code迎来最强中国对手！企业Agent有救了～

2026-01-26

终于来了！首款可视化 Skills 神器开源，Claude/Cursor/Codex 一键同步！

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全新AI编程工具 Google Antigravity 实测，特别适合产品经理

2025-11-19

2025-12-22

让白宫“破防”的阿里千问，我替你们测了...

2025-11-17

豆包手机同款AutoGLM硬核开源：AI如何用“眼睛+大脑+手”接管你手机

2025-12-10

最强开源0.9B级OCR模型！PaddleOCR-VL本地一键部署，私密性拉满【喂饭级教程】

2025-11-07

我把Claude Code换成GLM-4.7用了6小时，我竟然没发现明显区别

2025-12-23

Claude Code最强开源对手！GitHub 50.2k Star了，作者为它烧掉2.4w美元。

2026-01-06

把任何文档变成Claude的新技能，这个开源工具火了。

2025-11-06

SkillsMP：一个聚合了 5 万+ AI Agent 技能的开源社区

2026-01-12

Dify迎来最强开源对手！这个本地Agent内置微调+超细权限控制~

2025-11-03

大家都在问

Clawdbot爆火：Karpathy点赞的开源AI助理，到底是什么？

2026-01-26

速递 | DeepSeek突然扔出MODEL1，这到底是V4还是R2？

2026-01-21

DeepSeek-R2要来了？

2026-01-21

TranslateGemma-27B谷歌开源翻译模型有多强？

2026-01-20

构建开放智能体生态：AgentScope 如何用 A2A 协议与 Nacos 打通协作壁垒？

2026-01-16

又是量化基金，第二个DeepSeek时刻到来了？

2026-01-02

2025-12-24

2025-12-22

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean