微信扫码
添加专属顾问
我要投稿
在Mac上轻松运行Qwen2.5-VL 7B视觉模型,体验本地AI的强大视觉理解能力! 核心内容: 1. Mac安装Ollama和下载Qwen2.5-VL 7B模型的详细步骤 2. 模型在文本/图片识别、信息抽取等方面的实际应用效果 3. 通过Python程序调用模型分析图片的实用方法
前几天在 Mac 上安装了 Ollama,并下载了 Qwen2.5-VL 7B 做了一些测试,整个过程还挺有意思,分享给大家。
进入 Ollama 官网 ,我的电脑是 Mac Studio ,所以选择 MacOS 下载 。
下载完成后,双击安装 ,安装完成后界面如下图:
Qwen 2.5-VL 是阿里巴巴通义千问团队开发的一款开源的旗舰级视觉语言模型。
它能够处理文本、图像和视频,并具备强大的视觉理解和交互能力。该模型有不同参数规模(如 3B、7B 和 72B),适用于从边缘 AI 到高性能计算的多种场景 。
下载 Qwen 2.5 VL 有两种方式 :
1、通过命令行请求
ollama pull qwen2.5vl:7b
2、通过 Ollama GUI 界面安装
在 GUI 界面选择模型 ,若未下载会显示下载图标,然后在对话框中输入任意文本即可自动下载。
下载完模型后,即可在对话框中进行对话。
当然我们也可以通过 ollama 启动模型后展开对话:
ollama run qwen2.5vl:7b
接下来,进行图片检测,图片如下:
检测结果:
我们也可以通过该模型识别图像中的文字、公式或抽取票据、证件、表单中的信息,支持格式化输出文本:
我们可以编写 python 调用 Ollama 接口,实现模型分析图片:
curl http://localhost:11434/api/chat -d '{
"model": "qwen2.5vl:7b",
"messages": [
{ "role": "user", "content": "写一段代码" }
]
}'
效果见下图 :
Qwen 2.5-VL 7B 简直就是“本地视觉小钢炮”。
笔者认为它尤其适合在如下场景中发挥作用:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-02
又是量化基金,第二个DeepSeek时刻到来了?
2026-01-01
RustFS:高性能的分布式对象存储,MinIO的国产化理想替代方案,比MinIO快2.3倍!
2026-01-01
0元部署“豆包手机”,穷鬼也能用AI助手远程控机windows一键运行版来了
2026-01-01
2026年了,部署个开源的 AI 协同文档编辑工具玩玩吧!15.3K Star!
2026-01-01
腾讯混元开源翻译模型1.5,端侧可部署,效果超越商用API
2025-12-31
阿里杀疯了!重磅开源 MAI-UI 手机GUI智能体:端云协同,性能吊打 Gemini!
2025-12-31
重塑人机交互:深度解析智谱 Open-AutoGLM 的技术底座与演进之路
2025-12-31
Anthropic 官方开源 Skills:Claude 智能体开发的“标准答案”
2025-11-19
2025-10-20
2025-10-27
2025-10-27
2025-11-17
2025-12-10
2025-10-29
2025-11-07
2025-10-24
2025-10-21
2026-01-02
2025-12-24
2025-12-22
2025-11-12
2025-11-10
2025-11-03
2025-10-29
2025-10-28