阿里云 AI 搜索开放平台新增：服务开发能力

发布日期：2025-05-08 13:54:36 浏览次数： 1764

作者：阿里云大数据AI平台

微信搜一搜，关注“阿里云大数据AI平台”

随着 AI 技术的快速发展，用户对以算法驱动的 AI 搜索相关能力需求日益增长。AI 搜索开放平台已提供20+原子化服务能力，可灵活组合搭建 AI 搜索。本期发布将重点解决用户在代码开发中的不便，通过集成 dsw 能力，新增 notebook 功能，为用户提供更便捷的代码编写、调试及运行环境，进一步提升服务调试体验。

产品能力

1.文档解析服务

支持文档、图片分钟级解析，针对 PDF、DOC、HTML、TXT 等文档，能够区分多种版式，从非结构化文档中提取出标题、分段等逻辑层级结构，以及文本、表格、图片、代码等信息，去除页眉、页脚、识别上标、下标等信息，以结构化的格式输出。

2.图片解析服务

针对架构图、分析图表等图片数据，提供图片内容理解服务，可基于多模态大模型对图片内容进行解析理解以及文字识别，也可基于 OCR 能力对图片文字进行识别，将文字信息提取出来，用于图片检索及问答等场景。

3.文档切片服务

提供通用文档切片服务，可基于文档语义、段落结构以及指定规则进行切分，以便提升后续文档处理及检索效率，输出的切片树可在检索召回时进行上下文补全。

4.多语言向量模型

文本向量化提供将文本数据转化为稠密向量形式表达的服务，支持多款不同语言、输入长度、输出维度的文本向量模型，可用于信息检索、文本分类、相似性比较等场景。
文本稀疏向量化提供将文本数据转化为稀疏向量形式表达的服务，稀疏向量存储空间更小，常用于表达关键词和词频信息，可与稠密向量搭配进行混合检索，提升最终检索效果。
向量微调服务提供向量模型调优服务，可通过定制训练向量降维模型，在不带来过多检索效果损失的情况下，辅助将高维度向量降低维度，以便提升性价比。

5.查询分析服务

提供 Query 内容分析服务，基于大语言模型及 NLP 能力，可对用户输入的查询内容进行意图识别、相似问题扩展、NL2SQL 处理等，有效提升 RAG 场景中检索问答效果。

6.搜索引擎

提供向量检索、文本检索引擎，可进行向量&文本内容存储、构建索引、以及在线向量&文本检索，开通引擎服务后，可与AI搜索开放平台丰富的 API 服务组合使用。

7.排序服务

提供 Query 及 DOC 的相关性排序服务，在 RAG 及搜索场景中，可通过排序服务找到相关性更高的内容并依次返回，引入排序服务可有效提升检索及大模型生成的准确率。

8.大模型内容生成服务

提供多种大语言模型服务，包含 DeepSeek 全系模型（含R1/V3及7B/14B蒸馏版本）、通义系列通义千问-Turbo（https://x.sm.cn/BYoxwgv）、通义千问-Plus（https://x.sm.cn/6yuEbHj）、通义千问-Max（https://x.sm.cn/EGjIvp5）大模型。同时内置 OpenSearch-通义千问-Turbo 大模型，该模型以 qwen-turbo 大规模语言模型为模型底座，进行有监督的模型微调强化 RAG 检索增强的能力，降低模型幻觉率。