我要投稿

官宣|Zilliz Cloud 建表功能大升级，更多检索类型支持，更低成本

发布日期：2025-06-21 13:45:57 浏览次数： 2171

作者：Zilliz

微信搜一搜，关注“Zilliz”

和大家分享一个好消息，最近， Zilliz Cloud 建表功能迎来了一次重要更新。本次更新在用户界面上完整对齐了 SDK 能力，并带来了全新的交互体验，希望大家在构建数据模型时，少些繁琐，多些高效。

这次更新主要包括七个方面，接下来我们来一一介绍。

全面支持全文检索与文本匹配能力

在新版本中，全文检索会通过术语相关性对文档进行排序，显著提升 RAG 和关键词场景的准确性。它直接处理原始文本并自动生成稀疏向量，无需手动 Embedding。而文本匹配非常适合精确的词项过滤和查询。过去，用户只能在 SDK 使用全文检索功能，用户需要理解 input text field + function + output sparse field 的组合关系，步骤容易遗漏导致创建失败。在新版界面中，我们对这两项功能做了全面升级：

引导式全文检索配置：用户现在只需选择一个 VARCHAR 列，配置 Function（支持 Standard 或 Custom Analyzer），再选择一个 Sparse Field，即可完成全文检索设置。右侧还提供对应的 SDK 示例代码，帮助用户快速理解并顺畅切换到代码模式。
直观的文本匹配功能：用户可以在界面中为指定字段直接启用文本匹配，满足精确匹配词语或短语的需求，提升配置效率与可用性。

简化数据组织：Partition和Partition Key概念澄清

理解 Zilliz Cloud 中 Partition 和 Partition Key 的区别，对于优化性能至关重要。Partition 是一个 Collection 的物理子集，共享相同的 Schema 但仅包含部分数据，有助于隔离数据并提升查询性能。使用 Parition Key 则能在超多租户场景中，基于某个标量字段隔离租户以优化查询性能。过去，用户只能在 SDK 中创建和管理 Parition，非常不便。同时，两者名称相似且互斥，用户容易混淆，并且配置错误后的修改成本很高（需要重新插入数据）。本次优化，我们提供了：

更清晰的解释： 在建表时，我们现在清晰地解释了 Partition key 和 Partition 的区别，引导用户根据实际场景选择合适的租户粒度和 Partition key 字段。

独立的分区管理页面： 新增了一个独立页面，支持创建、预览 Partition，并能将数据直接导入到指定 Partition。

此外，当使用 Parition Key 时，Parition 由系统自动创建，界面会禁用Parition 创建入口，避免用户误操作。

Mmap 精细化控制，按需配置，释放内存潜力

Mmap （内存映射）是一项强大的技术，能有效减少内存占用，让每个 CU 处理更多数据，尤其适用于处理大数据量或不常访问的字段。以前，Mmap 只能在建表时开启，后期修改只能通过 SDK 操作，SDK 也没提示需要先 Release 后才生效。更棘手的是用户很难区分集群级别、表级别、列级别、原始数据和索引数据 Mmap 设置的差别。基本靠猜测，一旦出错会影响业务性能。本次优化，我们提供了：

更细粒度的控制： 明确定义了字段、集合、集群级别的 Mmap 作用优先级
灵活的配置： 用户现在可以在表级别和列级别轻松开关 Mmap，并能分别针对原始数据和索引数据分别配置
实时预览与便捷修改： 可以在 Schema 页面预览 Mmap 状态。如果需要修改，只需 release collection 即可在页面中完成

支持Nullable和default value设置，提升容错，界面更简洁

设置字段的 Nullable 属性和 Default Value 对于提高数据写入的容错性，以及处理不完整或动态结构的数据至关重要。过去，它们占据了建表界面的显眼位置，但大多数字段并不需要设置，反而干扰了高频操作。本次优化我们将这些设置收起，既满足了功能需求，又确保了高频操作的易用性，使主要的建表流程更加简洁。

完整索引生命周期管理，新增标量索引

索引是提升向量检索性能的核心组件。 过去，Zilliz Cloud 建表流程仅支持创建向量索引，而标量索引需通过 SDK 配置，使用体验不统一。同时，界面默认仅创建向量索引，缺乏对标量索引作用的说明，导致许多用户在高频使用标量字段进行筛选时未配置索引，进而严重影响查询性能。本次改版，提供了：

全面的索引模块： 新建表流程中包含了完整的索引模块，解释了创建索引的必要性，并引导用户按需创建
独立的索引管理页面： 新增了一个独立页面，支持新建、删除和预览所有索引，实现了完整的生命周期管理
支持 JSON Path 索引： 支持最新的 JSON Path 索引，显著提升了 JSON 和动态字段的查询速度

Shard与Consistency Level配置，掌控数据分布与可见性

Shard 和 Consistency level 是 Collection 两个重要能力，Shard 是Collection 的水平分区，提供独立的写入通道，能显著提升写入吞吐量。一致性级别决定了在搜索和查询操作中跨副本最新数据的可见性，默认 Bounded 级别平衡了数据新鲜度与性能。过去，这俩个选项在建表界面中是隐藏的，用户很难了解默认设置是否满足需求，一旦不符就可能面临高昂的重新建表成本。现在，我们直接在界面中展示这些默认配置，并支持您根据实际需求进行修改，同时还提供了不同配置的作用及最佳实践，帮助用户轻松做出最适合的选择。

Dynamic field 展示优化，理解更直观

Dynamic filed 对于数据结构不固定、需要频繁新增列的场景非常有用，插入数据时可直接添加新字段而无需更新 Schema。过去界面仅将其视为一个开关，用户不易理解其与其他向量/标量列的关系。本次调整，在 Schema 设计中将其与标量列、向量列并列展示，并辅以描述和使用场景说明，帮助用户理解这也是一种特殊的列类型，并了解其能力差异。