我要投稿

NVIDIA 培训 | 学习使用 NVIDIA NIM 部署生产级 RAG 应用

发布日期：2024-07-10 19:46:19 浏览次数： 3127

作者：NVIDIA英伟达企业解决方案

微信搜一搜，关注“NVIDIA英伟达企业解决方案”

《使用 NVIDIA NIM 大规模部署 RAG 工作流》

新课发布

配有实战练习环境的在线自主培训

在现代企业商业智能化的发展中，检索增强生成（RAG）在大语言模型应用中的地位日益凸显。不仅能够显著提升企业内容创作与交互的智能化水平，还能在多个业务场景中实现精准信息抽取与高效内容生成。企业级的 RAG 应用需要应对巨大流量和大规模文档，从模型搭建到生产级部署具有很高的复杂度和参数量。

本课程探讨 RAG 工作流生产级部署的最佳实践。您将学习部署、监控、自动扩展、线上热更新的全工作流。为您在搭建部署过程中，降低试错成本，加速大模型应用落地。

课程时长：4 学时（课后 6 个月内可以继续访问课件，实验资源用量有限额）

课程语言：中文

工具、库、框架：NVIDIA NIMs、Kubernetes、Helm、Grafana、Prometheus

学习目标：

使用 Helm 和 NVIDIA RAG Operator 将 RAG 应用部署到 Kubernetes 集群上。
利用 NVIDIA NIM 实现可扩展的容器化 LLM 和嵌入模型。
连接、更新、添加和自动扩展应用组件。
使用 Prometheus 和 Grafana 监控应用性能。

课程大纲：

课程设置概述：熟悉课程的交互式环境、Kubernetes 设置，并了解课程所需的 Kubernetes 概念和命令。
基于 Kubernetes 的 RAG 应用部署：如何使用 Kubernetes 和 Helm 部署 RAG 工作流，以及如何在工作流中使用单个 NIM 服务。
监控：如何使用 DCGM 监控应用程序，以及如何配置和查看 Grafana 和 Prometheus。
自动扩展：基于自定义指标使用 HPA 自动扩展应用程序，并对应用程序进行负载测试。
自定义 RAG 工作流组件：替换应用组件，例如 LLM。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-04-27

Mem0 深度解析：智能记忆层的架构原理

2026-04-27

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-23

2026 年做搜索就是做 Agent Memory

2026-04-22

专题解读 | 可更新的检索增强知识库发展方向及进展

2026-04-22

AI实践｜基于 Spring AI 从0到1构建 AI Agent

2026-04-22

我搭建了Karpathy的个人知识库，但发现成本高速度慢，我用一个更好的方案替代了。

2026-04-21

多轮对话时，RAG反复做重复召回，模型层与Milvus层分别如何解决？

2026-04-20

Codeindex · 让大模型更好地理解你的代码

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

深度解析 PageIndex：无向量 RAG 框架的技术实现与原理剖析

2026-02-13

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

告别向量数据库！PageIndex：让AI像人类专家一样阅读长文档

2026-02-03

RAG 落地全干货深度分享：从“效果不理想”到生产级 RAG 系统的进化之路

2026-02-06

告别“伪智能”代码：用 Spec + RAG 打造真正懂你的AI程序员

2026-02-06

OpenViking：面向 Agent 的上下文数据库

2026-02-02

全网爆火的大模型AI知识库，保姆级教程来了

2026-04-06

知识基座：让“AI 越用越懂业务”的团队经验实践【天猫AI Coding实践系列】

2026-03-23

效率神器 Claude-Mem：终结 AI “金鱼记忆”！自动保存上下文、可视化记忆流，开发体验提升 10 倍！

2026-02-06

从 RAG 到 Agentic Search，一次关于信任 AI 判断的认知升级

2026-02-05

大家都在问

Karpathy的LLM Wiki + 3.5 万Star的Graphify：企业级 RAG 缺的真是知识图谱？

2026-04-27

多轮对话时，RAG反复做重复召回，模型层与Milvus层分别如何解决？

2026-04-21

企业AI落地三重门，用友如何破局？

2026-03-17

Embedding相似度虚高，如何用langchain+Milvus搭建CRAG解决？

2026-03-11

不用向量数据库的 RAG，居然跑得更准了？

2026-02-22

当RAG遇上Agent记忆：为什么相似度检索会"塌方"？

2026-02-15

Claude Cowork 真能替换 RAG ？

2026-02-04

使用 Agent Skills 做知识库检索，能比传统 RAG 效果更好吗？

2026-02-03

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部