支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


官宣|Zilliz Cloud 建表功能大升级,更多检索类型支持,更低成本

发布日期:2025-06-21 13:45:57 浏览次数: 1519
作者:Zilliz

微信搜一搜,关注“Zilliz”

推荐语

Zilliz Cloud建表功能重磅升级,全文检索、分区管理、内存优化三大核心能力全面提升,助你轻松应对复杂数据场景。

核心内容:
1. 全文检索与文本匹配功能全面优化,支持自动化稀疏向量生成
2. 分区管理逻辑重构,新增独立管理页面与智能防误机制
3. Mmap内存映射技术实现精细化控制,显著提升资源利用率

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

和大家分享一个好消息,最近, Zilliz Cloud 建表功能迎来了一次重要更新。本次更新在用户界面上完整对齐了 SDK 能力,并带来了全新的交互体验,希望大家在构建数据模型时,少些繁琐,多些高效。

这次更新主要包括七个方面,接下来我们来一一介绍。

全面支持全文检索与文本匹配能力

在新版本中,全文检索会通过术语相关性对文档进行排序,显著提升 RAG 和关键词场景的准确性。它直接处理原始文本并自动生成稀疏向量,无需手动 Embedding。而文本匹配非常适合精确的词项过滤和查询。过去,用户只能在 SDK 使用全文检索功能,用户需要理解 input text field + function + output sparse field 的组合关系,步骤容易遗漏导致创建失败。在新版界面中,我们对这两项功能做了全面升级:

  • 引导式全文检索配置:用户现在只需选择一个 VARCHAR 列,配置 Function(支持 Standard 或 Custom Analyzer),再选择一个 Sparse Field,即可完成全文检索设置。右侧还提供对应的 SDK 示例代码,帮助用户快速理解并顺畅切换到代码模式。

  • 直观的文本匹配功能:用户可以在界面中为指定字段直接启用文本匹配,满足精确匹配词语或短语的需求,提升配置效率与可用性。

简化数据组织:Partition和Partition Key概念澄清

理解 Zilliz Cloud 中 Partition 和 Partition Key 的区别,对于优化性能至关重要。Partition 是一个 Collection 的物理子集,共享相同的 Schema 但仅包含部分数据,有助于隔离数据并提升查询性能。使用 Parition Key 则能在超多租户场景中,基于某个标量字段隔离租户以优化查询性能。过去,用户只能在 SDK 中创建和管理 Parition,非常不便。同时,两者名称相似且互斥,用户容易混淆,并且配置错误后的修改成本很高(需要重新插入数据)。本次优化,我们提供了:

更清晰的解释: 在建表时,我们现在清晰地解释了 Partition key 和 Partition 的区别,引导用户根据实际场景选择合适的租户粒度和 Partition key 字段。

独立的分区管理页面: 新增了一个独立页面,支持创建、预览 Partition,并能将数据直接导入到指定 Partition。

此外,当使用 Parition Key 时,Parition 由系统自动创建,界面会禁用Parition 创建入口,避免用户误操作。

Mmap 精细化控制,按需配置,释放内存潜力

Mmap (内存映射)是一项强大的技术,能有效减少内存占用,让每个 CU 处理更多数据,尤其适用于处理大数据量或不常访问的字段。以前,Mmap 只能在建表时开启,后期修改只能通过 SDK 操作,SDK 也没提示需要先 Release 后才生效。更棘手的是用户很难区分集群级别、表级别、列级别、原始数据和索引数据 Mmap 设置的差别。基本靠猜测,一旦出错会影响业务性能。本次优化我们提供了

  • 更细粒度的控制: 明确定义了 字段集合集群 级别的 Mmap 作用优先级

  • 灵活的配置: 用户现在可以在表级别和列级别轻松开关 Mmap,并能分别针对原始数据和索引数据分别配置

  • 实时预览与便捷修改: 可以在 Schema 页面预览 Mmap 状态。如果需要修改,只需 release collection 即可在页面中完成

支持Nullable和default value设置,提升容错,界面更简洁

设置字段的 Nullable 属性和 Default Value 对于提高数据写入的容错性,以及处理不完整或动态结构的数据至关重要。过去,它们占据了建表界面的显眼位置,但大多数字段并不需要设置,反而干扰了高频操作。本次优化我们将这些设置收起,既满足了功能需求,又确保了高频操作的易用性,使主要的建表流程更加简洁。

 完整索引生命周期管理,新增标量索引

索引是提升向量检索性能的核心组件。 过去,Zilliz Cloud 建表流程仅支持创建向量索引,而标量索引需通过 SDK 配置,使用体验不统一。同时,界面默认仅创建向量索引,缺乏对标量索引作用的说明,导致许多用户在高频使用标量字段进行筛选时未配置索引,进而严重影响查询性能。本次改版,提供了:

  • 全面的索引模块: 新建表流程中包含了完整的索引模块,解释了创建索引的必要性,并引导用户按需创建

  • 独立的索引管理页面: 新增了一个独立页面,支持新建、删除和预览所有索引,实现了完整的生命周期管理

  • 支持 JSON Path 索引: 支持最新的 JSON Path 索引,显著提升了 JSON 和动态字段的查询速度

Shard与Consistency Level配置,掌控数据分布与可见性

Shard 和 Consistency level 是 Collection 两个重要能力,Shard 是Collection 的水平分区,提供独立的写入通道,能显著提升写入吞吐量。一致性级别决定了在搜索和查询操作中跨副本最新数据的可见性,默认 Bounded 级别平衡了数据新鲜度与性能。过去,这俩个选项在建表界面中是隐藏的,用户很难了解默认设置是否满足需求,一旦不符就可能面临高昂的重新建表成本。现在,我们直接在界面中展示这些默认配置,并支持您根据实际需求进行修改,同时还提供了不同配置的作用及最佳实践,帮助用户轻松做出最适合的选择。

 Dynamic field 展示优化,理解更直观

Dynamic filed 对于数据结构不固定、需要频繁新增列的场景非常有用,插入数据时可直接添加新字段而无需更新 Schema。过去界面仅将其视为一个开关,用户不易理解其与其他向量/标量列的关系。本次调整,在 Schema 设计中将其与标量列、向量列并列展示,并辅以描述和使用场景说明,帮助用户理解这也是一种特殊的列类型,并了解其能力差异。

除了以上各项功能升级,我们还把 Data Import 页面融合进了 Data Preview,进一步精简了产品界面。

我们深知,准确构建数据 Schema 是一项挑战,而后期任何调整都可能带来不小的成本。正因如此,我们努力通过这次更新,提供更直观的界面和更清晰的功能说明,让用户能次性创建出最理想的数据模型,有效减少重复工作。帮助用户把重心从数据准备转移到核心的向量检索任务上,精力聚焦于应用端的创新上~

立即登录 Zilliz Cloud,亲自感受这些优化带来的便利。我们非常期待了解一线的使用反馈,并据此持续迭代产品!


作者介绍

Zilliz 高级产品经理 汤雪


推荐阅读
索引选不对,成本贵十倍!一文读懂向量索引选型
官宣:Zilliz Cloud 推出审计日志功能
官宣| Zilliz Cloud 推出在线迁移功能,无感迁移不停机
AI法律*百亿向量,Zilliz 助力美国法律AI独角兽Filevine服务5000+律所

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询