随着 AI 技术的快速发展,用户对以算法驱动的 AI 搜索相关能力需求日益增长。AI 搜索开放平台已提供20+原子化服务能力,可灵活组合搭建 AI 搜索。本期发布将重点解决用户在代码开发中的不便,通过集成 dsw 能力,新增 notebook 功能,为用户提供更便捷的代码编写、调试及运行环境,进一步提升服务调试体验。
01
1.文档解析服务
支持文档、图片分钟级解析,针对 PDF、DOC、HTML、TXT 等文档,能够区分多种版式,从非结构化文档中提取出标题、分段等逻辑层级结构,以及文本、表格、图片、代码等信息,去除页眉、页脚、识别上标、下标等信息,以结构化的格式输出。
2.图片解析服务
针对架构图、分析图表等图片数据,提供图片内容理解服务,可基于多模态大模型对图片内容进行解析理解以及文字识别,也可基于 OCR 能力对图片文字进行识别,将文字信息提取出来,用于图片检索及问答等场景。
3.文档切片服务
提供通用文档切片服务,可基于文档语义、段落结构以及指定规则进行切分,以便提升后续文档处理及检索效率,输出的切片树可在检索召回时进行上下文补全。
4.多语言向量模型
文本向量化提供将文本数据转化为稠密向量形式表达的服务,支持多款不同语言、输入长度、输出维度的文本向量模型,可用于信息检索、文本分类、相似性比较等场景。
文本稀疏向量化提供将文本数据转化为稀疏向量形式表达的服务,稀疏向量存储空间更小,常用于表达关键词和词频信息,可与稠密向量搭配进行混合检索,提升最终检索效果。
向量微调服务提供向量模型调优服务,可通过定制训练向量降维模型,在不带来过多检索效果损失的情况下,辅助将高维度向量降低维度,以便提升性价比。
5.查询分析服务
提供 Query 内容分析服务,基于大语言模型及 NLP 能力,可对用户输入的查询内容进行意图识别、相似问题扩展、NL2SQL 处理等,有效提升 RAG 场景中检索问答效果。
6.搜索引擎
提供向量检索、文本检索引擎,可进行向量&文本内容存储、构建索引、以及在线向量&文本检索,开通引擎服务后,可与AI搜索开放平台丰富的 API 服务组合使用。
7.排序服务
提供 Query 及 DOC 的相关性排序服务,在 RAG 及搜索场景中,可通过排序服务找到相关性更高的内容并依次返回,引入排序服务可有效提升检索及大模型生成的准确率。
8.大模型内容生成服务
提供多种大语言模型服务,包含 DeepSeek 全系模型(含R1/V3及7B/14B蒸馏版本)、通义系列通义千问-Turbo(https://x.sm.cn/BYoxwgv)、通义千问-Plus(https://x.sm.cn/6yuEbHj)、通义千问-Max(https://x.sm.cn/EGjIvp5)大模型。同时内置 OpenSearch-通义千问-Turbo 大模型,该模型以 qwen-turbo 大规模语言模型为模型底座,进行有监督的模型微调强化 RAG 检索增强的能力,降低模型幻觉率。
02
1.丰富的 AI 搜索能力:
依托领先的模型底座训练AI搜索专属模型,内置搜索及 RAG 场景(https://x.sm.cn/DsWx8pl)全链路组件化服务。
2.灵活的调用方式:
通过 API、SDK 调用服务(https://x.sm.cn/2JjDMYF),方便开发者、企业客户及 ISV 技术人员将部分或全链路AI 搜索服务集成到自身业务链路中。
3.开箱即用:
开通后即可灵活调用全量服务(https://x.sm.cn/9l0UAfM)。
4.最佳实践:
基于 OpenSearch 多年在智能搜索、RAG 领域的沉淀,内置多种 AI 搜索最佳实践,可快速搭建更加适配业务需求的搜索链路。
03
1.创建服务开发实例
在 AI 搜索开放平台(https://x.sm.cn/1XYQx3E)选择模型服务>服务开发,然后单击新建开发实例。
输入实例名称和描述信息,选择实例资源规格,确定提交后系统开始部署实例。
详情见:https://x.sm.cn/DBrVnDj
2.服务开发
当创建的服务开发实例状态为运行中时,可通过以下入口进入 Notebook 开发环境:
从服务开发列表进入:
从场景中心,可一键进入场景开发环境:
从服务体验中心,可一键进入服务开发环境:
04
服务开发能力根据购买的 CPU/GPU 机型,消耗的计算资源计费,CU 单价为1.07元/CU/小时
若完成开发或调试可随时停止开发实例,停止后将暂停计费
对外透出机型:
部署服务的价格为:CU 单价*机型消耗的 CU 数量*购买机器个数
如:1台 ops.basic1.gi.large 部署开发服务的价格=1.07元/CU/小时*0.61*1=0.65元/小时
05
本次阿里云 AI 搜索开放平台服务开发能力的发布,旨在通过集成 dsw 能力并新增 notebook 功能,进一步提升用户编排效率。