微信扫码
添加专属顾问
我要投稿
BGE-M3: 由北京智源研究院(BAAI)开发的大型嵌入模型,其特点在于能够多功能、多语言和多粒度的广泛适用性。
BGE-Large: 一款英文训练的大型嵌入模型。
Paraphrase-Multilingual: 一款支持50多种语言的多语言嵌入模型,基于平行数据训练。
Ollama 新增了一个API端点 /api/embed,专门用于生成嵌入信息:
curl <http://localhost:11434/api/embed> -d '{
"model": "all-minilm",
"input": ["Why is the sky blue?", "Why is the grass green?"]
}'
这个API端点新增了以下特性:
批量处理:一次请求即可为多篇文档生成嵌入信息
标准化嵌入:嵌入信息现已标准化,进而提升了相似度测量的准确性
截断功能:新增了一个截断参数,若设为false则会报错
性能指标:响应结果中会包含 load_duration(加载时长)、total_duration(总时长)和 prompt_eval_count(提示评估计数)等性能指标
修复了 Windows 上初始下载速度慢的问题
NUMA 支持现在会被 Ollama 自动侦测,以提升性能
解决了 /api/embed 有时返回乱序嵌入结果的问题
? 合作/加群方式
? 往期好文推荐?
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-30
MCP入门指南:大模型时代的USB接口
2025-04-30
通俗易懂的梳理MCP的工作流程(以高德地图MCP为例)
2025-04-30
一文说明 Function Calling、MCP、A2A 的区别!
2025-04-30
MCP很好,但它不是万灵药|一文读懂 MCP
2025-04-30
旅行规划太难做?5 分钟构建智能Agent,集成地图 MCP Server
2025-04-29
10万元跑满血版DeepSeek,这家公司掀了一体机市场的桌子|甲子光年
2025-04-29
谷歌大神首次揭秘Gemini预训练秘密:52页PPT干货,推理成本成最重要因素
2025-04-29
一文说清:什么是算法备案、大模型备案、大模型登记 2.0
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-04-29
2025-04-29
2025-04-29
2025-04-28
2025-04-28
2025-04-28
2025-04-28
2025-04-28