微信扫码
添加专属顾问
我要投稿
随着大模型上下文窗口扩大到100K-200K Token(开源)或者200万-1000万字(商业),不少人开始质疑检索增强生成(RAG)是否已经过时?
| 企业机构 | 模型名称 | 上下文长度 | 开/闭源 | 是否中文 | |
| 360 | 360Zhinao-7B-Chat-360K | 360K | 开源 | 是 | |
| 猎户星空 | Orion-14B-LongChat | 200K-320K | 开源 | 是 | |
| 元象XVERS | XVERSE-Long-256K | 256K | 开源 | 是 | |
| 上海AI Lab | InternLM2-Chat-7B/20B | 200K | 开源 | 是 | |
| 零一万物 | Yi-6B-200K | 200K | 开源 | 是 | |
| 百川智能 | Baichuan2-192K | 192K | 开源 | 是 | |
| NousResearch | Yarn-Mistral-7b-128k | 128K | 开源 | 否 | |
| Anima | Anima-7B-100K | 100K | 开源 | 否,中文需要申请 | |
| Anthropic | Claude 2.1 | 200K | 闭源 | 是 | |
| 智谱AI | GLM4 | 128K | 闭源 | 是 | |
| OpenAI | ChatGPT-Turbo | 128K | 闭源 | 是 | |
| 月之暗面 | Kimi Chat | 20万字 | 闭源 | 是 | |
| 月之暗面 | Kimi Chat Longer | 200万字 | 闭源 | 是 | |
| 通义千问 | qwen | 1000万字 | 开/闭源 | 是 | |
LangChain团队(Lance Martin 软件工程师)结合几个最新研究项目成果来探讨、分析这个问题。通过多针“大海捞针”方法,深入分析了长上下文大模型在事实推理和检索(reasoning & retrieval in long context LLMs)方面的局限性,接着分析了长上下文给RAG带来的新变化,如以文档为中心的索引技术(RAPTOR+Long embeddings)和RAG的流程变化(Self-RAG、CRAG)。
多针“大海捞针” :https://blog.langchain.dev/multi-needle-in-a-haystackChallenge may be recency bias in LLMs:https://arxiv.org/pdf/2310.01427.pdfRAG from scratch:https://github.com/langchain-ai/rag-from-scratchRAG新突破RAPTOR: https://github.com/parthsarthi03/raptorDense X Retrieval: https://arxiv.org/pdf/2312.06648.pdfTogether Embeddings:https://www.together.ai/blog/embeddings-endpoint-releaseSelf-RAG:https://arxiv.org/abs/2310.11511CRAG:Corrective Retrieval Augmented Generation https://arxiv.org/abs/2401.15884
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-22
不用向量数据库的 RAG,居然跑得更准了?
2026-02-22
AIOps探索:做运维领域的RAG,如何做数据清洗
2026-02-21
Claude Code 每次都要重新探索代码?这个工具直接省下30%成本
2026-02-18
函数计算 AgentRun 重磅上线知识库功能,赋能智能体更“懂”你
2026-02-15
当RAG遇上Agent记忆:为什么相似度检索会"塌方"?
2026-02-15
查个问题还要全图跑一遍?DA-RAG说我只取一瓢
2026-02-14
OpenClaw 终于能"记住"事了!我花了 3 周折腾出的长期记忆系统
2026-02-13
深度解析 PageIndex:无向量 RAG 框架的技术实现与原理剖析
2025-12-04
2026-01-15
2025-12-03
2025-12-02
2026-01-02
2025-12-23
2025-12-07
2025-12-18
2026-02-11
2026-02-03
2026-02-22
2026-02-15
2026-02-04
2026-02-03
2026-01-19
2026-01-12
2026-01-08
2026-01-02