我要投稿

AIGC之Ollama 本地大模型应用实战

发布日期：2024-06-26 17:21:52 浏览次数： 2898

作者：顶层架构领域

微信搜一搜，关注“顶层架构领域”

Ollama 是一个开源项目，旨在简化在本地部署和运行大型语言模型（LLMs）的过程。它提供了一系列工具和功能，使得开发者和研究人员能够更容易地在自己的机器上利用这些先进的AI模型，而无需依赖云端服务。

官网：https://ollama.com

Github：https://github.com/ollama/ollama

一、运行环境准备

Ollama 官方提供了 Docker 镜像安装，可以在 Docker Hub 上获取：

Docker Hub ：https://hub.docker.com/r/ollama/ollama

二、模型库提供商

提供商：https://ollama.com/library

运行 7B 模型需要至少 8GB 的 RAM，运行 13B 模型需要 16GB RAM，运行 33B 模型需要 32GB RAM。

三、运行本地大模型

运行并与 Llama 3 进行交流，可以使用以下命令：

四、命令行操作 CLI 参考

创建模型

ollama create selfModel -f ./Modelfile

更新模型

ollama pull llama3

删除模型

ollama rm llama3

复制模型

ollama cp llama3 self-llama3

多行输入

使用 """ 包裹文本

>>> """Hello,... world!... """I'm a basic program that prints the famous "Hello, world!" message to the console.多模态模型>>> What's in this image? /Users/aid/smile.pngThe image features a yellow smiley face, which is likely the central focus of the picture.

提示作为参数传入

$ ollama run llama2 "Summarize this file: $(cat README.md)" Ollama is a lightweight, extensible framework for building and running language models on the local machine. It provides a simple API for creating, running, and managing models, as well as a library of pre-built models that can be easily used in a variety of applications.

列出已安装模型列表

ollama list

启动 Ollama

ollama serve

五、源码构建Ollama

安装 cmake 和 go：

brew install cmake go

然后生成依赖项：

go generate ./...

然后构建二进制文件：

go build .

更详细的说明可以在开发者指南中找到。

运行本地构建

启动服务器：

./ollama serve

在shell 中，运行模型：

./ollama run llama2

六、REST API文档提供

详细信息查看文档

https://github.com/ollama/ollama/blob/main/docs/api.md

查看更多集成案例，可以查看github仓库文档

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-02-03

Claude Code——智能路由与切换工具

2026-02-03

作为投资方，我们试了试Kimi K2.5

2026-02-03

暴涨11.7k Star！复刻Manus上下文工程的开源Skills，Claude code等多个平台即插即用

2026-02-03

ollama v0.15.4 更新：OpenClaw全面上线，优化集成流程与工具解析能力大升级！

2026-02-03

阶跃星辰 Step 3.5 Flash 上线！更快更强更稳的 Agent 大脑，开源！

2026-02-02

一分钟部署OpenClaw+QQ，国内最爽的一键启动！

2026-02-02

这家字节系AI初创，推出首个开源Agent Skills Builder！对话Refly.AI李锦威：大多数Agent都停留在专业用户层面，没有做到真正的普惠

2026-02-02

OCR又出宠OpenDoc，速度超MinerU6倍

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

全新AI编程工具 Google Antigravity 实测，特别适合产品经理

2025-11-19

Clawdbot 完整安装教学：2026 年最火的开源AI 个人助理

2026-01-27

一文彻底看懂 Google 最新开源 A2UI 协议：如何让 AI Agent “说出UI” ？

2025-12-22

豆包手机同款AutoGLM硬核开源：AI如何用“眼睛+大脑+手”接管你手机

2025-12-10

让白宫“破防”的阿里千问，我替你们测了...

2025-11-17

SkillsMP：一个聚合了 5 万+ AI Agent 技能的开源社区

2026-01-12

最强开源0.9B级OCR模型！PaddleOCR-VL本地一键部署，私密性拉满【喂饭级教程】

2025-11-07

我把Claude Code换成GLM-4.7用了6小时，我竟然没发现明显区别

2025-12-23

Claude Code最强开源对手！GitHub 50.2k Star了，作者为它烧掉2.4w美元。

2026-01-06

Clawdbot 深度拆解： 7 个问题看懂它。

2026-01-29

大家都在问

一夜爆火，Clawdbot是否才是真正的AI入口产品？

2026-01-28

Clawdbot爆火：Karpathy点赞的开源AI助理，到底是什么？

2026-01-26

速递 | DeepSeek突然扔出MODEL1，这到底是V4还是R2？

2026-01-21

DeepSeek-R2要来了？

2026-01-21

TranslateGemma-27B谷歌开源翻译模型有多强？

2026-01-20

构建开放智能体生态：AgentScope 如何用 A2A 协议与 Nacos 打通协作壁垒？

2026-01-16

又是量化基金，第二个DeepSeek时刻到来了？

2026-01-02

被 Gemini 官方推荐为下一代Agent！Eigent 如何实现企业级浏览器自动化？

2025-12-24

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部