微信扫码
添加专属顾问
我要投稿
1. Zilliz 与英伟达、OpenAI、Intel 等建立官方合作伙伴关系背后的故事 2. Oracle 的经历对创立 Zilliz 有什么影响?当时看到了什么机会? 3. 向量数据库最被低估和高估的各是什么? 4. 向量数据库如何解决大模型幻觉问题?是否是目前最佳方案? 5. Milvus 2.4版本实现了哪些技术创新,如何做到较以往50倍性能提升? 6. 为什么一开始就选择开源?如何看待开源的价值? 7. Zilliz Cloud 作为云服务产品,面对不同类型客户如何平衡易用性和企业级需求? 8. 为什么和云服务 bundling 是 Zilliz 唯一的商业模式?向量数据库能否向上/向下延伸? 9. 面对愈发激烈的向量数据库市场竞争,Zilliz 将如何保持领先、构建壁垒? 10. Zilliz 在全球化发展方面有什么经验和策略?AI 时代中国创业者如何走向世界? 11. Long-context 长上下文的发展对向量数据库有何影响? 12. Transformer 遵循的冯·诺依曼架构未来可能颠覆吗?对向量数据库的影响是什么? 13. 向量数据库的想象空间有多大?是否有颠覆传统数据库巨头的机会? 14. 极客范+浪漫主义的文化对企业创新和发展有什么价值?
IDC 预测地址: https://www.forbes.com/sites/forbestechcouncil/2022/02/03/the-unseen-data-conundrum/?sh=4880bfa87fcc
红杉美国博客: https://www.sequoiacap.com/article/generative-ai-act-two/ A16Z 博客: https://a16z.com/emerging-architectures-for-llm-applications/
市场预测地址: https://www.marketsandmarkets.com/Market-Reports/vector-database-market-112683895.html
Intel Vision: https://www.intel.com/content/www/us/en/events/on-event-series/vision.html Gaudi 3:https://www.intel.com/content/www/us/en/products/details/processors/ai-accelerators/gaudi3.html
论文地址:https://dl.acm.org/doi/abs/10.1145/362384.362685
投资 Pinecone:https://a16z.com/announcement/investing-in-pinecone/
Milvus Github 地址:https://github.com/milvus-io/milvus
访谈地址:https://www.youtube.com/watch?v=6R7YCX4Q91Q
当我们开始创办 Pinecone 的时候,我们问了一个很基本的问题:为什么人们需要开源平台?没错,其中一个原因是为了赢得信任,另一个是为了获得社区的贡献,还有一个原因是为获得用户提供渠道。我们想,只要我们做得出色,提供令人惊叹的服务,就能赢得信任,我们不需要外部贡献。 事实上,如果你看一下统计数据,即使是开源公司,99%的贡献实际上来自于公司本身,不一定是 99%,但肯定超过95%。因此,这实际上并没有什么大的区别。
如果你可以不做开源,你就应该避免,这是一个循序渐进的挑战。因为通过开源,你可以获得分发渠道,但随后你必须找出商业模式。让一个开源项目成功就像在高尔夫球中的一杆进洞,你拿起一根棒球棒,你必须打一场全垒打,因为接下来你必须做第二次行动,确保这个东西真正作为一个公司运作。
Advent of Code:https://adventofcode.com/
Towhee:https://github.com/towhee-io/towhee Attu:https://zilliz.com/attu GPTCache:https://zilliz.com/what-is-gptcache
论文地址:https://arxiv.org/abs/2005.11401
由于 Gemini 在处理长上下文方面表现出色,甚至有人高喊「RAG 已死」。比如爱丁堡大学博士符尧在评价 Gemini 1.5 Pro 的帖子中写道:「大语言模型已经是非常强大的检索器,那么为什么还要花时间构建一个弱小的检索器,并将时间花在解决分块、嵌入和索引问题上呢?换句话说:一个拥有1000万 token 上下文窗口的大模型杀死了 RAG。」
文章地址: https://zilliz.com/blog/will-retrieval-augmented-generation-RAG-be-killed-by-long-context-LLMs
大模型技术正在改变世界,但无法改变世界的运行规律。自冯·诺依曼架构诞生之日起,存储器、计算器和外存就是分开的,即使在单机内存已经达到 TB 级别的今天,SATA 硬盘和闪存依然在不同应用场景下发挥着重要的价值。对于大模型而言,长期记忆的重要性也将持续存在。AI 应用的开发者一直在追求查询质量和成本之间的完美平衡。当大型企业将生成式人工智能投入生产时,他们需要控制成本,同时保持最佳的响应质量。RAG 技术和向量数据库依然是实现这一目标的重要工具。
另一个悬而未决的问题是,随着大多数模型上下文窗口的增长,嵌入(embedding)和向量数据库将如何发展。人们很容易说嵌入将变得不那么相关,因为上下文数据可以直接放入提示中。然而,专家们对这个主题的反馈表现出了相反的情况——随着时间的推移,embedding pipeline(嵌入管道)可能会变得更加重要。长上下文窗口是一个强大的工具,但它们也需要大量的计算成本。因此,有效利用它们成为当务之急。我们可能会开始看到不同类型的嵌入模型变得流行,直接针对模型相关性进行训练,以及旨在利用和实现这一点的向量数据库。
对话地址: https://www.youtube.com/watch?v=c3b-JASoPi0&list=PLOhHNjZItNnOoPxOF3dmq30UxYqFuxXKn&index=4
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-30
旅行规划太难做?5 分钟构建智能Agent,集成地图 MCP Server
2025-04-29
10万元跑满血版DeepSeek,这家公司掀了一体机市场的桌子|甲子光年
2025-04-29
谷歌大神首次揭秘Gemini预训练秘密:52页PPT干货,推理成本成最重要因素
2025-04-29
一文说清:什么是算法备案、大模型备案、大模型登记 2.0
2025-04-29
MCP:AI时代的“万能插座”,大厂竞逐的焦点
2025-04-29
打起来了!MCP VS A2A,谁才是Agent的未来事实标准?
2025-04-29
Google 的 A2A 与 MCP 该如何选择?还是两种都用?
2025-04-29
一站式AI应用开发平台 Firebase Studio
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-04-29
2025-04-29
2025-04-29
2025-04-28
2025-04-28
2025-04-28
2025-04-28
2025-04-28