支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


超级干货,秒变大神|三个底层认知帮你AI应用效果提升300%

发布日期:2025-07-02 20:58:10 浏览次数: 1541
作者:闻说咸语

微信搜一搜,关注“闻说咸语”

推荐语

掌握这三个AI应用底层认知,让你的工作效率提升300%,告别"人工智障"时代!

核心内容:
1. 专业知识工程:将法律知识转化为AI指令的核心方法论
2. 可信数据源建设:确保AI检索结果准确可靠的关键
3. 注意力容量管理:优化人机对话效率的实用技巧

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

在之前的系列文章中,我们已经完成了对于AI时代合同审核、法律检索这两大基础法律实务技能的应用探讨。(实际上,「合同审核」和「法律检索」对应的是AI文本理解/生成、AI检索这两项基本功能。)

今天我们再来总结一下这些AI 协作中的共性诀窍,聊聊三个可以帮助你大幅提升AI应用效果,把“人工智障”变成真正“人工智能”的「认知」。

当然我个人可能更倾向于称之为“AI时代的基本常识”——这些真的不是多么高深的技术要点或者深刻思维,就只是类似于“蛋炒饭用隔夜的米饭炒出来更好吃”的简单小tips而已。

本文内容包括:

  1. 认知一:「专业知识工程」与提示词工程
  2. 认知二:「可信数据源」与法律检索、知识库建设
  3. 认知三:「注意力容量」、对话与智能体
  4. 延伸|假如再让AI发展十年,律所/律师的核心壁垒是什么?
  5. AI法律应用系列终极彩蛋

1.「专业知识工程」

1.1 什么是专业知识工程?

引用KC律师(AI律师实验室的联合创始人及首席AI布道师)的表述:

专业知识工程是将法律专业知识转化为有效的AI指令的方法和技术,这些AI指令可以指导AI模型执行法律任务。专业知识工程的主要步骤是:

·提炼法律专业知识

·转化提炼后的专业知识为AI指令集

·检验AI指令的效果

·改善法律专业知识/AI指令

我是KC,公众号:KC的AI实验室法律人使用AI的正确方式:别想“训练”,更别“提问”,请您“指令”

1.2 专业知识工程和提示词工程有什么区别?

提示词工程是指研究各种更优化的提示词编写技巧、提示词结构,来获取更高质量的AI输出结果。

相信大家也经常刷到各种《法律人必学提示词XX》《DeepSeek+法律,26个常用提示词(建议收藏)》……之类的文章。

专业知识工程和提示词工程存在交叉之处(实际上专业知识工程可以视作一种特殊类型的提示词构造思路),二者的主要差别在于:

  • 专业知识工程默认AI不具备完成任务所需的专业知识(因此这部分需要用户额外提供),让AI有效完成任务的核心在于「提供正确的专业知识」,提示词则处于次要地位。
  • 提示词工程预设AI已经具备了完成任务所需的知识,用户只需要通过精巧的提示词引导AI调用这部分知识,然后按步骤输出结果。「提示词构造」处于核心地位。

1.3 为什么法律场景更适合专业知识工程而非提示词工程?

因为法律专业知识具有更强的专业性、严谨性、时效性要求,AI大模型训练中使用的互联网数据,并不足以使AI具备足够的法律专业能力。

大家可以将AI近似的视作一个靠互联网自学成才的实习生,ta很擅长百度网上的各种公开信息,但是没有接受过完整的专门法学训练。这样一位互联网毕业的实习生同学所理解的“法律”和各种“法律概念”,和法律实务中所要求的各种法律概念大概率是不一致的。

如果你在向其交付任务时,不提供必要的背景知识信息,以锚定双方使用的“概念”在同一语境,同一内涵,则即使再完善的工作步骤(提示词)也可能会出现驴唇不对马嘴的情况。

尤其当你要求AI完成一项它并不具备相关知识的工作时,AI往往就会选择“编造”一个像模像样的答案出来。

相反,在让AI完成法律相关工作时,给出足够清晰明确的方法步骤和相关所需知识(包括法律知识和业务知识),就是一种非常有效的AI输出物质量提升方法。

1.4 是否用专门的法律数据训练出法律专业AI大模型,就不需要专业知识工程了?

这里不去谈专业法律AI大模型是否可行,是否有必要的问题,实际上随着AI技术发展,我们会发现通用的AI大模型也越来越懂法律。

但AI的本质是用大数据训练出来的对于“下一个字”的概率预测机,换句话说即使这种概率预测再精确,实质上AI具备的都是通过大数据获取的一种“语感”。

所以要想更好发挥出AI的这种“语感”,我们始终需要向AI提供足够清晰、明确的“语境”——即使仅在法律内部,同一语词在不同语境、不同领域、不同时间下也可能具备不同的含义,而提供当下相关的专业知识就是一种锚定语境,从而避免“谈话不在一个维度”,减少幻觉的最佳方式。

1.5 有了DeepSeek R1等推理大模型,是否还需要专业知识工程?

DeepSeek R1等推理大模型现世之后,研究者们发现比起说清目标后让AI自由推理发挥,人类输入的提示词反而会降低AI的输出结果表现。

也就是说,绝大多数时候,与其人类通过提示词工程教AI做事,不如让AI自己“深度思考”效果更好。

那么推理AI是否还需要专业知识工程?

答案是提炼出的法律专业知识,依然可以提升AI输出的准确性,减少幻觉率。

以DeepSeek R1为例,一般会发现R1在只开启深度思考时,因为训练数据只到2023年,所以幻觉很严重,准确度一般;但是如果同步打开联网模式,让R1可以基于网络搜索到的信息进行回答,则会显得聪明很多。

此时,专业知识工程就是在特定的法律任务场景中主动向R1提供背景知识,以此来替代R1自己上网搜索,从而进一步提升R1的工作表现。
(毕竟法律场景中,网络信息中存在着大量的谬误)

1.6 有没有专业知识工程应用的具体示例?

具体示例可参见:《审查清单|最实用高效的AI审合同方案及清单知识管理智能体分享》这里面的审查清单就是一种特定合同审核任务场景的“专业知识”,有没有合同审核清单,AI审核的质量效果可谓是天壤之别。

同时,让实习生完成某项工作任务时也是一样,比起直接丢一个SOP操作步骤就让实习生上手干,先和实习生对齐相关背景知识,再按步骤完成,显然可以大幅减少出岔子的可能性。比如《一个指导实习生用AI审核合同的prompt》,思路就是指引实习生自行研究调研,然后与主办律师对其知识、方案后再开展工作。

而《实机演示&纯干货|用deepseek审合同的真实完整工作流教学》其中主要部分也是通过前置的检索来获取足够的特定合同审核专业知识。

(我们会发现,这些专业知识不一定必须是只存在于律师脑海中,互联网上没有;而也可以是律师先通过检索从互联网的数据之海中检索整理出特定所需的知识,再提供给AI ,从而避免AI自己引用到低质数据,提升AI表现效果。)

提示词工程中强调的“给AI一个结果示例可以有效提升AI输出质量”,这个“结果示例”实际上也可以看作一种专业知识。

2.「可信数据源」

2.1 什么是可信数据源?

可信数据源是指在法律检索中,可以作为法律意见依据的,兼备准确性、真实性及效力性、权威性的数据信息来源。

可信数据源根据建设主体的不同可大致分为三类:

  • 官方权威数据源,包括各种官方机构门户网站、裁判文书网、信息网络公示系统等,具有最高的权威性;
  • 社会可信数据源,包括各类专业法律数据库、各律所、律师发表的专业公众号文章等,一般可以作为找到官方权威数据的指引;
  • 自有数据源,律所或律师自建的知识库、数据库等,具有最强的业务适配性,需投入时间精力定期更新维护。

2.2 可信数据源如何影响检索效果?

与专业知识工程的思路一致,AI只有在优质输入的前提下,才能有优质的输出。

在文书类作业的场景中,我们可以通过主动向AI专业知识来保障输入数据的质量;而在法律检索的场景中,我们就需要通过选择合适的可信数据源,来保障检索结果的质量。

2.3 如何在使用AI法律检索时,选择合适的可信数据源?

主要需注意的是,不同的AI工具可以接触到的数据源是不同的:

  • 官方数据源信息基本上无法通过AI检索获取;
  • 社会数据源信息中,各专业法律数据库的信息必须通过对应的专门AI检索工具获取,一般的通用大模型无法接触;
  • 自有数据源,同样只能通过接入相关知识库的AI工具才能获取。

(相关具体参见:《渔|AI时代的法律检索教程(01 工具与数据源篇)》

使用AI工具进行法律检索前,先了解该AI工具可接触到的数据源范围十分有必要。

2.4 如何在使用AI搜索时保障信息准确性,避免幻觉?

之前DeepSeek很火的时候,会有很多教程说在使用DeepSeek进行法律检索时,要加一句“不要编造案号”或“必须基于真实的案件”云云,但实践后往往会发现这类提示词的效果有限。

因为原生的DeepSeekR1没有接触到那些可信数据源的权限,只能基于低质量的互联网信息来生成答案。DeepSeek确实可以自己尽量不编造,但难保互联网小编们可以有多严谨。

而专业法律数据库加载的开源DeepSeek时检索结果会准确很多,也并不是因为其算法更厉害,而只是因为这些DeepSeek进行检索时有更优质的数据输入。

同样,最懂你,最懂你的业务的AI,也必定只会是能够接触到你的自有业务数据的AI。

所以避免幻觉的要点还是“保证AI在工作时有优质的信息输入”。保证优质信息输入的方式包括采购专业的数据库或自行收集建设业务知识库。

3.「注意力容量」

3.1 什么是注意力容量?

注意力容量是我自己认知AI的一个概念,是指AI在一次对话中能够有效记住和处理的信息限度。

基于成本、响应时间、生成长度限制等因素,我们面对的AI并不是可以完美全部理解长篇大论意思的超级智能,而更像是被响应时间等kpi赶着走,快速看完赶紧干活儿,不管怎样先反馈点什么的苦逼牛马。

也就是说,单轮对话中,AI单次可调用的算力资源,可集中的“注意力”是有限度的。

这意味着如果单次输入的提示词过长、过于复杂,超出了这个容量限度,就很容易导致AI抓不住其中的重点,关键指令被稀释,或者处理时遗忘上下文。

这点对人类实习生也一样,要求一次性完成一个过于复杂的任务,也会很容易把小实习生的脑瓜烧坏。

3.2 如何规避注意力容量限制,提升AI输出效果?

注意力容量限制有个潜在前提,即“单个AI单次对话”,所以应对思路有三个:即增加对话轮次,或增加AI数量,又或者选择更合适的AI。

3.2.1 增加对话轮次

增加对话轮次一方面是可以将复杂的复合型任务拆分为多个单一型子任务,一轮对话运算只让AI完成一项任务(详见《渔|AI时代的法律检索教程(03 AI自然语言检索方法篇)》

另一方面是在任务完成的流程设计中给出AI在对话中修改完善的空间。基于“AI的方向是尽可能实现对人类思维、人类自然语言的高度模拟”这个基点,可以预判“一定程度的不确定性/模糊性会是AI的固有属性”,所以我们从原理上就不可能设计一个完美的提示词,然后AI百分百给到一个完美答案,中间不能有谬误,否则就是一个需要修复的“BUG”。要给到AI的提示词实际上是一个关于此项问题的相对完善的“谈话方案”,真正的成果需要在对话中产生。

简单来说,比如可以主动在提示词中要求AI“执行任务前,先向我提问任务所需背景信息”,比如AI反馈的结果不符合需要时,对话反馈修正点;或者要求AI自己检查结果是否符合需要,还有没有优化空间。

3.2.2 增加AI数量

增加AI大模型数量即通过编排任务流,让多个AI大模型使用不同任务插件按照一定顺序来共同完成任务,也即智能体(相当于给实习生分工组成专项任务完成小组)。

比如我想要用AI来帮我「测算日运,给我当天的运势建议」,这个复合任务中的子任务包括: 将公历日期时间换算对应的农历日期和八字(如将2025年6月19日1点转换为乙巳年、壬午月、己未日、甲子时) 将八字转换为对应的五行属性(如将乙巳转化为阴木-阳火、阳金、阳土) 根据五行生克等传统玄学理论推理,预测运势

我们会发现,一项看似简单的「测算日运,给我当天的运势建议」工作,实际上包含着三项涉及到不同的专业知识和计算的子任务,如果直接要求大模型在一次对话运算中给出结果,就很难得到理想的答案。

但是将这三项任务分别交给三个AI来完成,并辅以相应的插件或知识,则最后这个AI小组就可以给出质量很不错的答案。

具体的智能体搭建手把手保姆级教程,可以参见:《AI知识管理智能体搭建教程|问答、文章、工具、管理,一把炼成!提问即产出,知管自动化》篇幅所限,本文不做展开。

3.3 选择更合适的AI

虽然我们一直统称“AI”,但由于不同的算法和训练方向,各家的大模型适用方向、擅长能力也是有所区别的。所以花费同样的算力,A大模型可能只发挥出10分的效果,但B大模型可能可以发挥出100分。就好像有些实习生擅长检索,有些更擅长审合同,还有的很有写文章的创造性。

也就是说,不要轻易的下“XX任务不适合AI完成”的结论,即使某个大模型表现不佳,也可以先试试其他的大模型。

小结

综合前面三个认知的探讨,我们可以得到一条关于AI应用的公式:

AI输出效果 = 输入数据 x 调用算力 x 算法

(注:这里的乘号可能不是特别严谨,数据、算力、算法三者之间的关系实际上更为复杂,但陶律师如今数学也就到加减乘除这个样子,就这样吧)

对于律师来说,其中的算法很难干涉,最多只能选择不同AI厂商的产品;算力也很难影响,最多想办法尽量适应厂商的算力限制;而数据则是律师的优势所在,大量的法律专业知识(包括显性知识和隐性知识)并不公开在互联网中,且会随着社会发展而快速变化、更迭。

「专业知识工程」和「可信数据源」的部分分别从文书工作和检索工作两个场景探讨了“输入数据质量”的重要性,「注意力容量」部分则探讨了如何通过合适的任务对话策略,在有限的可调用算力和相对固定的算法背景下,尽可能提升AI的效用表现。

4.延伸|假如再让AI发展十年,律所/律师的核心壁垒是什么?

还是上面的公式:AI输出效果=输入数据x调用算力x 算法

算力、算法都属于大资本的游戏,作为法律专业知识工作者,能够掌握的就是“优质的输入数据”这一项。

如果律所或律师团队能够将其积累的特定领域的数据、业务经验,有效的工程化,转化为适合为AI利用的专业知识,建立自有且独有的可信数据源——由此把此前未被有效利用、常常隐性存在的业务经营数据转化为AI时代的高价值生产资料,通过AI不成比例的放大其专业知识复利,在成本上、优质数据积累上,形成难以逾越的数据壁垒。

这其中的关键在于建设这样一个达到一定规模的独有的优质数据池,然后为这个数据池匹配足够的算力和合适的算法(本地化部署)。

而不掌握自有数据源的律师,大概率会像90年代到如今的“司机”职业一样——确实没有被替代,但也确实没有什么壁垒,靠劳动力挣一个平均的工资就很不错了。当然,这些司机里也会分为有人脉给领导开车的、服务好开专车的、跑长途的、拉货的,但整体上不会再像90年代那样,作为收入远超平均工资的“金饭碗”。

届时的法律市场可能就是这样若干个掌握独有数据源的大型组织(可能是律所,也可能是别的),加上大量的滴滴律师。

当然,这些大型组织中可能也会有很多新的岗位,比如法律知识工程师等。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询