我要投稿

RAG（检索增强生成）入门：结合DeepSeek与知识库，让AI回答更精准！

发布日期：2025-06-26 08:25:28 浏览次数： 1932

作者：德丶钰

微信搜一搜，关注“德丶钰”

还记得那个让我彻夜难眠的项目吗？客户要求构建一个企业级智能客服系统，能够基于公司内部文档回答用户问题。

最初我天真地以为，直接调用GPT-4就能搞定一切。结果呢？AI要么胡编乱造一些看似合理的答案，要么干脆承认"我不知道"。那一刻我意识到，传统的生成式AI在处理特定领域知识时存在致命缺陷——它们无法实时获取最新信息，更无法准确引用企业内部文档。

这就是我与RAG（Retrieval-Augmented Generation，检索增强生成）技术结缘的开始。

当传统AI遇到知识边界

传统的大语言模型就像一位博学的学者，拥有广博的通识知识，但知识截止时间固定，无法获取实时信息。更要命的是，当你问及特定领域的专业问题时，它们往往会"创造性地编造"一个听起来很有道理的答案——这在业界被戏称为"AI幻觉"。

RAG技术的出现彻底改变了这一局面。它的核心思想简单而精妙：先检索相关信息，再基于检索到的内容生成答案。这就像给AI配备了一个实时的"外接大脑"，让它能够访问最新、最准确的知识库。

RAG架构的"三重奏"

经过多个项目的实战，我总结出RAG系统的三个核心组件：

1. 知识向量化存储

首先，我们需要将文档转换为向量表示。我在项目中使用了sentence-transformers库：

from sentence_transformers import SentenceTransformerimport numpy as np# 加载预训练模型model = SentenceTransformer('all-MiniLM-L6-v2')# 文档向量化documents = ["公司成立于2020年..."， "产品特性包括..."]doc_vectors = model.encode(documents)

这一步的关键在于选择合适的embedding模型。中文文档建议使用text2vec-chinese等针对中文优化的模型，效果会显著提升。

2. 智能检索系统

当用户提问时，系统首先将问题向量化，然后在知识库中检索最相关的文档片段：

import faiss# 构建FAISS索引dimension = doc_vectors.shape[1]index = faiss.IndexFlatIP(dimension)  # 使用内积相似度index.add(doc_vectors.astype('float32'))# 检索相关文档query = "公司什么时候成立的？"query_vector = model.encode([query])scores， indices = index.search(query_vector.astype('float32')， k=3)

这里我踩过一个坑：相似度计算方法的选择至关重要。余弦相似度适合长文档，而内积相似度在短文本场景下表现更佳。

3. DeepSeek增强生成

最后，将检索到的相关文档作为上下文，调用DeepSeek API生成最终答案：

import requestsdef generate_answer(query， retrieved_docs)：    context = "\n".join([f"参考资料{i+1}： {doc}" for i， doc in enumerate(retrieved_docs)])
    prompt = f"""    基于以下参考资料回答问题，如果参考资料中没有相关信息，请明确说明。
    参考资料：    {context}
    问题：{query}
    回答：    """
    response = requests.post(        "https：//api.deepseek.com/v1/chat/completions"，        headers={"Authorization"： f"Bearer {api_key}"}，        json={            "model"： "deepseek-chat"，            "messages"： [{"role"： "user"， "content"： prompt}]，            "temperature"： 0.1  # 降低随机性，提高准确性        }    )    return response.json()["choices"][0]["message"]["content"]