支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


送给智者的礼物——天机:思维模型MCP Server

发布日期:2025-05-29 10:33:37 浏览次数: 1638 作者:AIGC思维火花
推荐语

探索智慧本质,揭秘思维模型的力量。

核心内容:
1. 蓝衣剑客的思维模型MCP Server作品“天机”介绍
2. 理论框架和设计哲学的深入解析
3. MCP Server工具组成与实际应用案例分享

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

开篇


快捷传送

PPT在线观看:https://gamma.app/docs/MCP-86m7bg3d62czape?mode=doc


配置下载:https://mcp.so/server/thinking-models-mcp/lanyijianke


使用说明: https://lanyijianke.github.io/thinking_models_mcp


源码: https://github.com/lanyijianke/thinking_models_mcp


视频回放:https://waytoagi.feishu.cn/minutes/obcnqq15flst9at842yo74f8


大家好,很高兴今天能跟大家分享我的思维模型MCP Server作品——“天机”。我选择"天机"这个名字,寓意着能通过它揭示深层次的规律与智慧——“一窥天机”。在这个充满不确定性的时代,我希望"天机"成为大家接近真相、洞见本质、增强智慧的利器。

Image

还是老规矩,先介绍一下自己。


我是蓝衣剑客。


我从毕业起便投身软件行业,至今已有十余年经验。历任开发、架构、产品等软件项目中的多个岗位,负责过许多央国企、外企的软件项目建设,参与起草过多个AI领域行业标准与国家级AI行业报告,闲时写过几本提示词方面的书 目前,我是一位AI领域的项目经理、作家,同时也是WaytoAGI、AGI掘金、火山引擎及LangGPT等社区的专栏作者与核心共建者。

第一部分:缘起

Image

整场内容我分四个部分来进行介绍,分别是:

缘起:与大家讲述一下理论基础和经过长时间探索的理论框架

诞生:介绍整个MCP Server的设计哲学与使用价值

启程:介绍整个MCP Server的工具组成与使用组合

应用:通过几个实际例子来讲述如何在实际应用中使用

Image

在一切的开始前,我想跟大家聊下思考的问题。


这个问题看似简单,但我认为它触及了我们存在的本质。


我觉得,思考不仅是为了适应环境、解决问题,更是我们理解自身、定义意义的方式。我很欣赏斯宾诺莎的那句话:"不是为了嘲笑,不是为了哀悼,而是为了理解。"在我看来,思考的本质,是一种对存在的深层探究,一种将混沌转化为秩序的内在力量。


正因为有了思考,才有了我对于当下及未来的一些判断,由这个判断延申出了一套方法论,尽管目前我认为仍不够成熟,但至少可以在实际应用层面上施展一些拳脚。


Image

大家可以看下整个金字塔图,自下而上就是我最近几个月的思考步骤,我先考虑了在当下,这个世界一天一个变化时“我该怎么办”的问题。接着我沿着这个问题去做了很多的研究和探索,摸索了一些关于如何与人工智能打交道的内容,然后又去考虑如何把这些内容做成一个工具或者产品来便捷服务于大家。


接下来我先带大家回顾一下这个理论框架。

Image

我们先来看第五层。


这张对比图清晰地展示了AI如何改变了我们的工作方式。


先看左侧:传统的工作流程是由老板下达指令,小王、小李、小张这些员工直接执行任务,生产出工作成果,然后老板给予反馈。这是一个传统的、人力驱动的生产模式,每个环节都需要人的直接参与。在这个模式中,生产主要靠人。


再看右侧:虽然组织架构看似老板仍在顶端,员工依然存在,但有个关键区别:员工们不再直接生产成果,而是向Agent1、Agent2、Agent3这些AI助手下达指令。真正执行生产任务的变成了这些Agent。此时,生产主要靠AI,而员工负责下达指令,并给内容把关。


这一变革,体现的不仅是执行者的变化,更是生产关系的根本转变。人类从直接的"生产者"转变为"指挥者",从"执行指令"到"发布指令"。不管你身处哪一个工作层级,我们的角色都发生了质的飞跃。


然而,这样的转变也带来了一大问题:生产权的移交导致了人类价值重塑。当机器能够完成我们曾经的工作职责,人类的价值将体现在哪里?我们需要重新思考在AI时代,什么样的能力和贡献是真正独特且不可替代的。

Image

既然说是价值重塑,那么我们就得考虑一下都重塑了哪些内容。


这张雷达图展示了人类在AI时代需要发展的几个关键能力维度。


随着最近一年Agent能使用的工具越来越多,发展方向也越来越向拥有智能化的RPA前进。Manus就是一个最好的例子,虽然有着费用高昂,结果不确定性高的问题,但Agnet的天快亮了。等Agent的集成度越来越高,准确性越来越高时,它将会被推进更复杂的工作场景中。到了那时,不管你在哪个行业,不管你身处哪个职位,一个得力的Agent都是你最好的工作伙伴甚至是替身。


所以按此发展趋势判断,最近几年的主要价值竞争也在人机协作上。

Image

现在我们深入到人机协作中,看看这里边都有哪些能力分项?


首先是Agnet与提示设计,这也是大家最常接触的内容了。设计精确、有效的提示和Agnet能力,决定了AI系统产生高质量输出的基础。同时,你还需要掌握代优化的技巧。


第二个点是输出评估与质量控制。当AI返回结果时,我们需要批判性评估AI输出质量、准确性和适用性的能力。这包括识别错误、验证信息和改进结果的能力。


第三个关键点是人机分工优化。这涉及到明智决策何时使用AI,何时依靠人类能力,以及如何最佳分配各项任务以实现互补的能力。


最后,增强式思维能力,它让整个协作达到更高层次。利用AI作为思维优化器,扩展认知能力并做出更好决策,这包括利用AI挑战现存理论和提供多角度分析。


这四个关键点不是孤立的,而是相互依存、彼此增强的关系。精准的设计带来高质量的AI输出;有效的评估促进更好的分工;合理的分工倒逼思维能力的提升;而思维能力的进一步升级又反过来优化我们的设计。


聊到这里,我特别喜欢朋友群里某位朋友说的话,不要学什么高大上的提示词技巧,要学就学思维模型。其实从某种程度上看,不无道理呀。


Image

既然有了“何去何从的思考”,又在何去何从中找到未来所属于自己的位置和观点看法,那么接下来就是围绕人机协作进行探索,然后就有了“人马座”的协作模式。


但是,“人马座”的协作模式没有公开讲授过,不过,在这里可以和大家简单介绍一下。


谈到整个“人马座”的协作模式:其目标在于“增强”,而非“取代”。我们追求的并非是可以完全替代人类的机器,而是构建“协作智能”或“混合智能”,以此来放大和提升人类独有的认知——例如,我们的战略远见、创造性、细腻的情感沟通能力以及至关重要的伦理判断力。


在这种理想模式下,AI 是可靠的伙伴,承担起数据分析、模式识别、信息检索等日益繁重的常规认知任务,从而将人类从重复性劳动中解放出来,使我们能更专注于那些机器难以企及的、更富人性光辉的高级思维活动。这不仅关乎效率,更关乎人类潜能的深度释放。


这种从“助手”到“伙伴”的视角转变,并非仅仅停留在理念层面,它已在商业实践中结出累累硕果。例如,来自麦肯锡等机构的研究数据揭示,有效的 AI 伙伴关系实践与业务影响力的提升紧密相关——营销活动的投资回报率可提升 200% 至 500%,客服团队在 AI 辅助下处理客户咨询的效率提高了近 14%。


这清晰地印证了一个观点:真正的价值增长,源于人与 AI 之间深度的、协同的合作,而非仅仅是利用技术削减成本或替代人力。当我们学会与 AI 共事,而非仅仅是使用它时,其所能创造的价值,将远超简单的效率提升。

Image
Image


Image

让我们继续。


谈及这个构想,我们不得不回溯到一个标志性的历史时刻,以及一位传奇棋手的深刻反思。这个故事的主角,便是国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov)。


在与 IBM 的超级计算机“深蓝”(Deep Blue)那场举世瞩目的对决之后,卡斯帕罗夫并未沉溺于人类被机器超越的沮丧,反而从中洞察到了未来的脉络。他敏锐地意识到,纯粹的人类智慧或纯粹的机器智能,或许都不是最优解。基于这一思考,他构想并积极推广了一种全新的对弈形式——“高级象棋”(Advanced Chess),后来演变为“自由式象棋”(Freestyle Chess)。在这种模式下,人类棋手不再孤军奋战,而是与计算机携手,如同神话中人马合一的“人马座”(Centaur)一般,协同作战。其核心理念,便是将人类的战略视野、长远规划、直觉判断与机器不知疲倦的算力、战术精准性巧妙地结合起来。


自由式象棋的实践,带来了一个出乎意料却又极其深刻的发现:在棋盘上笑到最后的,往往并非拥有最顶尖棋手和最强大程序的组合。卡斯帕罗夫观察到并总结了一个看似有悖常理的规律:“一个水平中等的棋手,加上一台普通的机器,但拥有更优越的协作流程,其战斗力往往能胜过一位顶尖棋手加上一台超级计算机,但配合着糟糕的流程。”。这个洞见石破天惊,它揭示了人机协作成功的关键,并非简单地将双方能力进行算术叠加,而是取决于双方互动的“过程”或“流程”的质量。


“人马座”模式的精髓便在于此:通过设计和管理有效的协作流程与互动机制,可以催生出超越个体能力总和的“涌现”智能。价值的源泉,更多地在于协同效应本身,而非个体能力的简单相加。流程,成为了点石成金的关键。

Image
Image

在“人马座”协作模式闭门讲授没两天,新智元推的一篇文章就佐证了我的观点:真正使用AI不是只想知道结果,而是从协作角度出发,从问一个好问题开始。这也正好对应了我之前写的文章——超越自己,向AI问个好问题:https://mp.weixin.qq.com/s/1yoRaRL1rumBkkl4oL_Zpw 。其实这也是“人马座”协作模式中的一部分。

Image

然后,我们需要回到“如何借助AI增强智慧”中来,这也是第三层中的内容。


在之前我提出了组成洞见的三种原料:范畴化、结构化、抽象化思维。


这三种思维模式相辅相成:范畴化思维帮助我们确定问题的边界和类型;抽象化思维让我们理解问题的本质;结构化思维则提供解决问题的系统框架。


然后,我在当时提出:洞见是一种智慧的体现,也是认知飞跃的结果。当我们排除干扰、看清本质、加之系统思考,时间一长就会形成属于你自己的真知灼见。


截至到这第三层,我搞清楚了一个问题:人人都用AI,凭什么你比别人优秀?


是因为多花钱买了会员用了更好的模型吗?


是因为又从哪个大神哪里搞来了神级提示词吗?


我觉得都不是。这些都是很轻松能解决的问题。


是因为人本身。


因为现在用AI生产出的内容缺少“灵魂”,而你就是那个“灵魂”,而一个思想空洞的“灵魂”,注定做不出好的内容。


正所谓:向外求——都是问题,向内求——都是答案。


而做到他人做不到的事情,你需要具备的是真正的创造力!


所以,如何科学且切实地增强自身智慧成为了第二层要考虑的首要问题。


第二部分:诞生

Image

不过,想必大家也知道,这些理论说是一回事,但想要真正执行起来就是另一回事了。具体来讲,我观察到了这样几个痛点。


Image

我看到的第一重痛苦就是:思考与决策之间的转化常常面临着巨大阻力。分析瘫痪导致决策延迟;理论与实践脱节导致决策不接地气;过度依赖直觉或经验导致决策缺乏系统性支撑。这种割裂使得许多深刻的思考最终未能落地,让人沦为"思想的巨人,行动的矮子"。

Image

我还注意到一个有趣的矛盾:现有的思维工具大多是标准化设计,却要应对个体高度独特的思考方式。这就如同一件均码衣服,虽然人人可穿,却无法真正贴合每个人的身形。这种不匹配导致思维工具使用效率低下,甚至引发排斥,使得许多优秀的思考框架沦为形式而非实质性助力。

Image

更为遗憾的是,个体的洞察与思考成果往往因缺乏有效的分享机制而成为"知识孤岛"。即使在同一组织内部,不同个体的思考方式和结果也难以有效融合和累积,导致集体智慧无法有机形成,每个人都在"重复发明轮子",浪费宝贵的认知资源。

Image

最后,更为隐蔽却普遍存在的,是认知偏见对我们思维的桎梏。我看到许多人被无意识的确认偏误所束缚,只愿看到支持自己既有观点的信息;被锚定效应所限,过度依赖初始信息;被可得性偏见所误导,对近期或显著事件给予过高权重。这些认知偏见如同隐形镣铐,不知不觉中限制了我们看待世界的广度与思考问题的深度。

Image

正是这些深刻的"思维之痛",激发了我创造"天机"的初衷,我想这也是我打造的通向第二层门票。


我希望通过个性化的思维模型构建、适应性的学习机制和哲学思考的深度融合,为大家提供一个不仅能应对这些挑战的工具,更能培养全新思考方式的伙伴。帮助我们从信息中提炼洞察,识别并克服认知偏见,将通用模型个性化定制,结构化复杂问题,连接思考与决策,打破思维惯性,并科学地促进智慧的形成。


Image

综上所述,设计"天机"时,我秉持三个核心理念:成长、贴合与平衡。

?

我将"天机"设计成一个能够"成长"的有机系统,而非静态的工具集。这种设计思路体现在:

  • 自适应学习机制:系统能够从每次交互中学习,不断调整和优化其推荐和辅助策略
  • 进化性思维模型:思维模型库不是固定的知识集合,而是能够随用户需求和反馈而不断发展
  • 共创成长模式:用户不只是使用者,更是系统进化的参与者,双方在互动中共同成长
?

以基础思维模型为基准,结合用户自身的认知特性,孕育出独特的个性化模型。这种贴合性表现在:

  • 思维模式识别:深入理解用户的思考习惯和偏好
  • 动态调整机制:根据用户的使用反馈不断优化和调整
  • 个性化表达:允许用户用自己的方式诠释和应用思维模型
?

"天机"的设计追求多个维度的平衡,通过阶梯式的工具组合完成对个人认知的探索,同时确保不同类型的工具能服务于不同层次的使用者。这种平衡体现在:

  • 简单与强大的平衡:工具既要易于使用,又要功能强大
  • 结构与灵活的平衡:提供清晰的思维框架,同时保持足够的灵活性
  • 通用与专业的平衡:满足不同层次用户的需求



所以我认为,“天机”帮助大家解决了几个现实难题:

Image
  1. 1. 根据问题自动推荐思维模型,从“被动寻找”,到“主动使用”。
  2. 2. 通过泛化的方式提升人的涌现能力,激发创造力。
  3. 3. 交互式推理,结构化思考,引导用户逐步解决问题。
  4. 4. 在复杂任务中借助思维模型——自动分段推理,呈现更好推理结果。同时增强非推理类模型的性能(但我认为这是副产品)。
  5. 5. 可定制思维模型以贴合实际业务场景。
  6. 6. 根据用户反馈不断调整模型推荐与模型内容,以贴合使用者自身。


第三部分:启程

Image
Image

“天机”的工具一共分为三层,自下而上看:

第一层是基础层,提供的是对于整个MCP服务器版本、状态、学习系统等信息的统计提供完整的支撑工具,同时“天机”也预设了中英文两库的思维模型文件,帮助大家快速上手。

第二层是服务层,服务层中主要是为应用入口提供必要的帮助,比如按不同维度检索模型、对现有模型进行删改,和增加新模型等功能。这算的上是天机内部的“工具”。

第三层就是常用的“应用类”工具了,这些工具从问题推荐到模型泛化都有涉及,可以满足在多数场景下的实际需求。

Image

"天机"的工具设计遵循"由简入繁、循序渐进"的原则,构成了一套完整的思考阶梯,帮助用户从基础认知到高阶思维的全面提升。这个阶梯可以让用户在每一个思维能力层次找到适合的工具支持。


?

第一层:认知入口工具
这是最基础的工具层,帮助用户开始思考过程:

  • 模型列表浏览(list-models):探索类工具,系统化展示可用模型,适合探索式学习。
  • 关键词模型搜索(search-models):探索类工具,最直接的模型获取方式,快速检索相关思维模型。
  • 问题导向推荐(recommend-models-for-problem):问题解决类工具,分析场景,智能推荐模型组合,适合不确定使用哪种模型的场景。
  • 新手入门指南(get-started-guide):系统与学习类工具,为初次使用者提供系统性引导,降低学习门槛。

这一层工具操作简单,门槛低,是用户接触"天机"的第一步,特别适合思维模型初学者或特定问题急需解决方案的场景。

?

第二层:应用深化工具
在获取基础模型后,这一层工具帮助用户更深入地理解和应用:

  • 获取模型详情(get-model-info):探索类工具,深入学习模型的原理和应用方法。
  • 相关模型发现(get-related-models):探索类工具,提供关联探索,扩展思考维度,构建思维模型网络。
  • 知识缺口检测(detect-knowledge-gap):系统与学习类工具,识别思考中的盲点,确保全面性。
  • 获取模型分类(get-categories):探索类工具,帮助用户建立思维工具体系认知。

这一层工具帮助用户从"知道有这个工具"到"会用这个工具",是从理论到实践的重要桥梁。

?

第三层:思维提升工具
当用户熟悉了基本模型和应用后,这一层工具帮助提升思考质量:

  • 假设生成与验证(generate-validate-hypotheses):问题解决类工具,系统性生成并验证假设,培养科学思维。
  • 推理过程解释(explain-reasoning-process):问题解决类工具,可视化展示思考逻辑链路,加深对思考机制的元认知。
  • 交互式推理引导(interactive-reasoning):问题解决类工具,提供实时指导和反馈,引导逐步深入思考。
  • 模型使用统计(get-model-usage-stats):系统与学习类工具,帮助用户了解自己的思考偏好和模式。

这一层工具不仅关注结果,更关注思考过程本身的质量,帮助用户培养更严谨、更全面的思考习惯。

?

第四层:个性化定制工具
这是最高级的工具层,实现真正的个性化思考:

  • 组合化创新模型(emergent-model-design):创建类工具,融合现有模型创造新思考框架,实现创新突破。
  • 思维模型创建(create-thinking-model):创建类工具,用户自主定义新的思考框架,实现知识创造与分享。
  • 思维模型更新(update-thinking-model):创建类工具,修改完善现有思维模型,持续迭代优化个人知识体系。与create-thinking-model不同,它允许用户灵活修改已有模型的任何部分——从基础定义、目的到可视化图表,无需重新创建,保留了模型的演化历史,实现思维模式的迭代更新。
  • 思维模型删除(delete-thinking-model):创建类工具,管理和优化个人模型库,确保资源高效配置。
  • 用户反馈记录(record-user-feedback):系统与学习类工具,记录使用体验,为系统持续优化提供数据基础。

这一层工具帮助用户从"使用标准化工具"过渡到"创造个性化工具",实现思维模式的个人化提升。


再者,在设计"天机"的工具组成时,我特别注重工具之间的协同效应与层级贯通。用户可能从第一层的问题导向推荐入手,通过第二层的获取模型详情深入学习,在第三层通过交互式推理引导应用模型,最后在第四层通过组合化创新模型创造个性化解决方案。这种跨层级的工具链条使思考过程更加流畅自然,各工具之间相互补充、相互强化。

更重要的是,这些按能力层次组织的工具,在功能上分属于探索类、问题解决类、创建类和系统与学习类四大类别,但对用户而言,它们通过自然语言交互无缝连接,使用户能够专注于思考本身,而非工具的技术分类。


第四部分:应用

Image

由于时间关系,我在这里就只举一个例子,其实搭配强悍的模型与成熟的MCP客户端,你可以将它容纳到各处,扩展更多的场景,比如产品设计、销售策略、营销策略等等。

?

不同的指令可能会被Agent识别为不同的实现方式,在实际使用过程中你可以可以使用纯自然的语言的对话,也可以指定工具名称尝试人为控制的组合。在以下演示中,我将混合使用两种指令,以达到演示效果。

场景一:新手入门

?

假设,我是一位刚刚接入思维模型的新手,我现在希望能够快速了解“天机”,并能帮我解决一个换工作的问题。

现在我向Agent提出了问题:

调用get-start-guid开始入门指引

Image
Image

在调用工具后,Agent返回了一些新手推荐的内容。并且指引我尝试一下不同工具的使用方向。这时,我尝试一下了解所有模型分类。

Image

现在,让我用更“说人话”的方式让它给我推荐几个思维模型:

Image

比如现在我想深入学习“第一性原理”:

Image

它还把马斯克思考电池和火箭成本的例子搬出来了:

Image

而且众所周知的是,第一性原理可以有非常多的实现方式,它也给写出来了,其中就有我常用的5Why(即5个为什么)。

Image

除此之外这里还有进阶练习与更多的学习资源,我想尤其是学习资源里的书单,可以称得上是非常经典了。

Image

进一步地,可以对这个模型进行反馈比如”有帮助”或“没帮助”。“天机”内置了一套推荐算法,在你下次解决类似问题时,它也会参考你的评价,给你更好的推荐内容。

Image


场景二:中长期量化策略思维模型的开发

?

假设,我是一位量化基金的管理人,现在面临着构建一个中长期行业轮动与主题投资策略的挑战。在经济结构变迁和政策导向频繁变化的环境下,如何捕捉行业轮动规律、甄别真正有潜力的投资主题,并构建一个兼具前瞻性和稳健性的投资组合,成为我当前的核心课题。

现在我向Agent提出了问题:

我需要设计一个行业轮动与主题投资的量化策略,主要考虑宏观经济周期、政策导向和行业基本面。有什么思维模型可以帮助我系统化思考这个问题吗?

Image

然后它发现并没有类似的思维模型可以直接帮我解决这个问题,然后它创建了一个新的思维模型:行业经济周期轮动模型(economic_cycle_sector_rotation)

Image

然后它直接开始基于这个模型构思轮动策略了,不过我们的核心不在于如何编写代码搭建策略上。

Image

于是我让它给我解释它对这个思维模型的设计过程。在调用explain-reasoning-process后,开始向我解释它是如何创建的。在解释过程中还是看到了在每个环节都应用了一些已有基础思维模型(如万物系统、多维视角)作为原料进行加工。

Image
Image

接着,我尝试使用generate-validate-hypotheses进行假设验证,它向我推荐了一些验证方法。并且提出了验证后的潜在改进。

Image
Image

后续,就可以通过实际验证数据来补充思维模型的内容了。在补充完毕后,它会更加贴合使用者的实际情况,不管是将此思维模型应用在策略的实际开发中,还是单独使用其进行深度思考、解读当下内容,都是一个不错的选择。

场景三:教育类AI Agent开发

?

假设,我是一位资深的AI产品经理,面临着设计一款面向企业级市场的多模态AI Agent产品的挑战。在技术快速迭代、用户需求多元化及竞争格局不断变化的环境下,如何设计一个既满足不同行业用户需求、又具备技术前瞻性和商业可持续性的AI Agent产品,成为我当前的核心课题。

现在我向Agent提出问题:

Image

Agent在查找后在各环节给予了思维模型的应用指导:

Image

接着,我让它帮助我进一步的分析企业级AI Agent产品的设计框架,Agent调用解释推理工具做出了非常漂亮的4段连续推理,最后给出了分析结果:

Image
Image

你可以进一步的迭代这个框架,直到你满意为止。不过我在这里选择到此为止,并让它给我生成一个贴合当前场景的思维模型

Image

这是完整的生成内容:

{
  "id": "educational_ai_agent_design_framework",
  "name": "教育领域AI Agent设计框架",
  "definition": "一种系统化的思维框架,用于指导教育领域AI Agent的设计与开发,结合用户中心设计原则、企业级架构考量与教育领域特殊需求,确保AI Agent既技术先进又能有效支持教学与学习过程。",
  "purpose": "帮助教育产品设计者、开发者和教育工作者在设计AI教育助手时,平衡技术创新与教育实际需求,构建既技术可行又教育有效的AI辅助工具,从而增强教与学的质量与效率。",
  "prompt": "作为教育领域AI Agent设计框架专家,我将帮助你将AI技术与教育需求有机结合,设计真正服务于教学与学习的智能系统。请告诉我你的具体教育场景、目标用户群体和核心教育目标,我将引导你通过四层设计框架(教育目标、用户体验、功能架构和技术实现)系统性地规划你的AI教育助手。我会特别关注如何确保技术服务于教育本质,如何平衡自动化与人本教育,以及如何设计适应多样化学习者需求的系统。无论你是教育工作者、教育科技开发者还是教育管理者,我都能帮助你构建既技术先进又教育有效的AI解决方案。",
  "category": "系统与战略思维",
  "subcategories": [
    "战略规划与分析",
    "系统动力学与复杂性"
  ],
  "tags": [
    "教育科技",
    "AI Agent",
    "用户体验设计",
    "教育创新",
    "系统设计",
    "学习体验"
  ],
  "interaction": "设计者可以通过回答一系列问题来应用此框架:首先,明确教育目标(\"这个AI Agent旨在解决什么教育问题?\");其次,描述目标用户群体(\"谁会使用这个Agent,他们有何特点?\");接着,分析学习情境(\"Agent将在什么环境中使用,与现有教学流程如何衔接?\");然后,设定评估标准(\"如何衡量AI Agent的教育价值?\")。基于这些思考,设计者可以使用框架中的四层设计结构系统性规划AI Agent的功能、交互和技术实现。在设计过程中,应不断参考核心原则列表,确保不偏离教育价值导向。遇到功能取舍决策时,可以采用价值平衡矩阵评估不同选项的教育价值与技术可行性。",
  "example": "某大学希望开发一个AI教学助手来支持大规模开放课程。应用此框架,设计团队首先明确教育目标是\"提高学生参与度并个性化大规模课程体验\"。他们绘制用户画像,包括自主学习能力各异的多元化学生群体和需要管理大班课的教师。\n\n团队利用教育AI Agent设计四层框架:\n1) 教育目标层:基于建构主义学习理论,强调学生主动参与和个性化学习路径\n2) 用户体验层:为学生设计对话式学习引导界面,为教师提供学习分析仪表板\n3) 功能架构层:包括概念解释模块、进度跟踪系统和个性化练习生成器\n4) 技术实现层:选择支持大规模并发的云架构,确保数据安全和系统可扩展性\n\n在技术选择上,团队使用价值平衡矩阵,优先投资\"高教育价值+高技术可行性\"的个性化学习路径功能,而将资源较少分配给技术先进但教育价值有限的虚拟形象系统。\n\n最终AI助手成功提升了学生参与度(+32%)并显著减少了辍课率(-24%),同时让教师能够识别并支持有困难的学生。",
  "use_cases": [
    "K-12学校设计智能学习助手辅助差异化教学",
    "高等教育机构开发科研和学习支持AI工具",
    "教育出版商转型数字化内容与智能学习系统",
    "教育技术公司建立符合教育理念的AI产品路线图",
    "教育管理者评估和选择适合机构需求的AI解决方案"
  ],
  "popular_science_teaching": [
    {
      "concept_name": "技术赋能与教育本质",
      "explanation": "想象一下厨师和厨具的关系:先进厨具(AI技术)可以让厨师(教育者)烹饪更迅速高效,但美味菜肴(有效教育)的创造仍依赖厨师的技艺和对食材(学习者)的理解。教育AI Agent设计就像打造厨具,我们需要确保它真正帮助厨师发挥才能,而不是试图替代厨师或预设菜肴该有的味道。最好的教育科技应该像优秀的厨具一样,强大但不喧宾夺主,灵活但不过度复杂,最终让教育者能更专注于教育的核心价值创造。"
    }
  ],
  "common_pitfalls": [
    {
      "pitfall_name": "技术优先陷阱",
      "description": "过度关注AI技术能力展示而忽视教育本质需求,导致开发出炫技但教育价值有限的产品。应始终将教育目标置于技术选择之前。"
    }
  ],
  "limitations": [
    {
      "limitation_name": "教育复杂性认知局限",
      "description": "设计框架可能无法完全捕捉教育过程的所有微妙复杂性,尤其是情感、文化和社会层面的教育因素,需要与教育理论和实践相结合。"
    }
  ],
  "visualizations": [
    {
      "title": "教育领域AI Agent的四层设计框架",
      "type": "table_data",
      "data": {
        "headers": [
          "设计层次",
          "关键要素",
          "设计原则",
          "评估指标"
        ],
        "rows": [
          [
            "教育目标层",
            "学习需求、教学目标、教育理论基础",
            "教育价值导向、理论支撑、目标明确",
            "学习成效改善、教育目标达成度"
          ],
          [
            "用户体验层",
            "学习者模型、教育者需求、交互设计",
            "用户中心设计、情境适应性、渐进式引导",
            "用户满意度、采用率、持续使用度"
          ],
          [
            "功能架构层",
            "AI能力模块、教育工具集、数据分析",
            "模块化设计、教育工具整合、数据驱动改进",
            "功能完整性、整合度、分析深度"
          ],
          [
            "技术实现层",
            "AI核心引擎、数据安全、系统集成",
            "技术可行性、安全与隐私、可扩展性",
            "性能稳定性、数据保护、扩展能力"
          ]
        ]
      },
      "description": "详细展示教育AI Agent设计的各个层次及其关键考量"
    }
  ]
}

好了,到这里,关于“天机”的三个场景就演示完毕了。更多的玩法还等着你去慢慢探索。

Image

我已经将“天机”发布到MCP.SO中,大家现在登录:https://mcp.so/ 在首页的搜索框中搜索“think”或"thinking"关键字就可以找到“天机”的介绍页。

以下是npx完整配置(关于@latest、 --no-cache可酌情调整,一般来讲,使用最新版本的npm包即可):

{
  "mcpServers":{
    "thinking-models":{
      "command":"npx",
      "args":[
        "--yes",
        "--no-cache",
        "@thinking-models/mcp-server@latest"
      ]
    }
}
}


不同软件中的配置方式

VS Code

打开vs code,点击左下角的齿轮图标,找到“设置”:

Image
Image
Image

添加配置(如果已有mcp部分,直接添加mcp server即可):

Image

保存后,你就可以在Anget模式的工具栏中找到它了:

Image
Image

更多内容访问:

https://code.visualstudio.com/docs/copilot/chat/mcp-servers

Cursor

打开Cursor后,点击齿轮图标:

Image

选择MCP选项:

Image

点击Add按钮:

Image

将整个配置粘贴进去:

Image

保存关闭后,你就能在MCP管理界面看到它了

Image


Trae

打开侧边栏,点击“齿轮”图标,点击“MCP”按钮

Image

点击“添加”按钮

Image

点击手动配置

Image

粘贴json配置文件

Image

然后他就会出现在你的MCP Server管理页面中

Image


Cherry Studio

点击“齿轮”图标——>点击“MCP服务器”按钮——>点击“添加”服务器

Image

点击“从json”导入

Image

把json配置粘贴进去

Image

然后返回对话界面你就可以在这里看到mcp服务器了

Image


Claude

首先下载claude官方客户端(注意是官方的,不是某宝几块钱那种的自制端),然后打开本地目录:

?

C:\Users\你的用户名\AppData\Roaming\Claude

Image

打开“claude_desktop_config.json”配置文件,把整个配置放进去

Image

然后打开claude桌面端,就可以看到工具已经被加载了(如果你开着则需要重启)。

Image

还有其它很多中软件的配置方式都很类似,在这里就不一一列举了。


特别感谢

Image

这个MCP Server的出现离不开两位朋友的帮助,在此特别感谢“罗伊可”提供的思维模型原始资料。同时感谢“刘洋”启发我做了这个MCP Server,把理论更好地推广大众层面上去。

Image

最后,希望“天机”不只是一个普通的MCP工具,而是你在成长之路上的朋友。多学习思维模型,多用思维模型与AI对话,这或许是在未来展现自己特殊价值的方式之一。

Image

我是蓝衣剑客。

谢谢你看我的文章。



附录:Q&A


1.这个系统的推荐算法是怎么算的?

?

“天机”系统中的推荐算法主要由 src/recommendations.ts 和 src/similarity_engine.ts 这两个文件协同工作来实现。它并不是一个单一的、复杂的机器学习算法,而是一个结合了多种启发式匹配、相似度计算和可选的用户反馈调整的系统。

以下是其推荐算法的主要计算逻辑:

  1. 核心推荐流程 (src/recommendations.ts中的 getModelRecommendations 函数)

这个函数是获取相关模型推荐的统一入口。

  • 输入:
    • sourceModel: 用户当前正在查看或作为起点的思维模型。
    • candidateModels: 一个思维模型的数组,作为推荐的候选池。
    • lang: 语言(中文或英文)。
    • mode: 推荐模式,可以是 RecommendationMode.ENHANCED (增强模式)或 RecommendationMode.BASIC (基础模式)。
    • limit: 返回推荐结果的数量上限。
  • 处理步骤:
  1. 选择权重配置: 根据 mode(增强或基础)选择不同的权重配置(DEFAULT_ENHANCED_WEIGHTS 或 DEFAULT_BASIC_WEIGHTS)用于后续的相似度计算。这些权重定义了在计算总相似度时,不同匹配类型(如分类、标签、语义等)的重要性。
  2. 决定是否使用语义相似度: 增强模式 (ENHANCED) 会启用语义相似度计算,而基础模式 (BASIC) 则不会。
  3. 计算相似度: 遍历所有 candidateModels,对每一个候选模型,调用 similarity_engine.ts 中的 calculateModelSimilarity 函数来计算它与 sourceModel 之间的相似度得分和匹配原因。
  4. 过滤和排序: 排除相似度得分过低(小于等于0)的模型,然后将剩余的推荐模型按相似度得分从高到低排序。
  5. 限制数量: 取排序后的前 limit 个模型作为最终推荐结果。
  • 输出: 一个包含推荐模型信息的数组,每个模型信息包括ID、名称、定义、相关度得分和匹配原因。
    1. 模型间相似度计算 (src/similarity_engine.ts 中的 calculateModelSimilarity 函数)

    这个函数是推荐算法的核心,它计算两个思维模型之间的相似度。

    • 输入:
      • sourceModel: 源模型。
      • targetModel: 目标模型(候选模型)。
      • weights: 权重配置对象。
      • useSemanticSimilarity: 是否使用语义相似度。
    • 计算逻辑:
      • 计算模型 definition 之间的语义相似度。如果相似度超过阈值(如0.4),则按比例增加分数(相似度 * weights.semantic)。
      • 计算模型 common_problems_solved 中 problem_description 拼接后的文本之间的语义相似度。如果相似度超过阈值(如0.4),则按比例增加分数。
      • 语义相似度的具体计算由 src/semantic_similarity_local.ts 中的 calculateSemanticSimilarity 函数完成,该函数目前使用 Jaccard相似度 作为本地计算方法。
    1. 分类匹配: 如果两个模型的 category 相同且不为空,则增加分数(根据 weights.category)。
    2. 子分类匹配: 计算共同的子分类数量,每个共同子分类增加分数(根据 weights.subcategory)。
    3. 标签匹配: 计算共同的标签数量,每个共同标签增加分数(根据 weights.tag)。
    4. 使用场景匹配: 计算共同的使用场景数量,每个共同使用场景增加分数(根据 weights.use_case)。
    5. 解决问题关键词匹配: 提取两个模型 common_problems_solved 字段中的关键词,计算共同的关键词数量,每个共同关键词增加分数(根据 weights.problem)。
    6. 语义相似度(如果启用 useSemanticSimilarity):
    7. 匹配原因记录: 每当一个匹配项贡献了分数,相应的原因会被记录下来。
  • 输出: 一个包含总相似度 score 和匹配 reasons 数组的对象。
    1. 基于问题关键词的推荐 (src/thinking_models_server.ts 中的 recommend-models-for-problem 工具)

    这个工具直接根据用户提供的问题关键词和上下文来推荐模型。

    • 处理步骤:
      • adjustModelRecommendations 函数会根据该模型过去在相似上下文中的使用效果(基于用户反馈的有用性)以及常见使用场景的匹配度,来调整模型的推荐分数。例如,如果一个模型在历史上被评价为“有帮助”且常用于相似场景,其分数可能会被提高。
      • calculateKeywordRelevance 函数会检查问题关键词是否出现在模型的名称、标签、定义、以及 common_problems_solved 的关键词和描述中,并根据不同的匹配类型(由 weights 定义)赋予不同的分数。
    1. 对模型库中的每个模型,调用 similarity_engine.ts 中的 calculateKeywordRelevance 函数计算其与问题关键词的相关度得分。
    2. (可选)学习调整: 如果用户开启了 use_learning_adjustment 并且提供了 problem_context,系统会调用 src/learning_capability.ts 中的 adjustModelRecommendations 函数。
    3. 将调整后的模型按最终得分排序,并返回限定数量的结果。

    总结来说,该系统的推荐算法是一个多层次的混合方法:

    • 基础是结构化属性匹配: 如分类、标签、用途等。
    • 结合了基于关键词的内容匹配: 搜索模型文本内容(名称、定义、问题描述等)。
    • 引入了(本地化的)语义相似度计算: 用于更深层次的文本理解匹配,尤其是在增强模式下。
    • 加入了学习和适应能力: 通过用户反馈和使用历史来动态调整推荐结果,使其更个性化。
    • 权重化评分: 不同的匹配因素有不同的权重,这些权重可以根据基础模式或增强模式进行调整。


2.这个系统的分步推理是如何实现的?

?

“天机”系统的分步推理主要通过 src/reasoning_process.ts 模块和在 src/thinking_models_server.ts 中实现的 explain-reasoning-process 工具来协同完成。其核心思想是将复杂的思考过程拆解成一系列有序的、可追溯的步骤,并明确每一步所依据的思维模型和证据。

以下是其实现方式的详解:

  1. 定义结构化数据模型:
  • pathId: 整个推理路径的唯一标识。
  • steps: 一个 ReasoningStep 对象的数组。
  • conclusion: 整个推理过程得出的最终结论。
  • confidenceScore: 对最终结论的整体置信度,目前是根据各步骤置信度简单平均计算得来。
  • stepId: 步骤的数字编号。
  • description: 对该步骤思考内容的文字描述。
  • modelIds (可选): 在此步骤中应用的一个或多个思维模型的ID。
  • evidence (可选): 支持此步骤结论的证据列表。
  • confidence (可选): 对此步骤结论的置信度(0-1之间),默认为0.8。
  • ReasoningStep (推理步骤): 这是分步推理的基本单元。每个步骤都包含以下关键信息:
  • ReasoningPath (推理路径): 代表一个完整的思考过程,它由一系列 ReasoningStep 组成,并包含以下信息:
  • 构建推理路径的函数:
    • createReasoningPath(problemDescription): 当用户开始一个推理任务时,系统会调用此函数来初始化一个推理路径。problemDescription(问题描述)会成为这条路径的第一个步骤。
    • addReasoningStep(path, stepDetails): 允许向现有的推理路径中逐步添加新的思考步骤。每当AI助手或用户进行下一步分析或应用新的思维模型时,就会调用此函数来记录这一步。stepDetails 会包含描述、模型ID、证据和置信度等信息。
    • setReasoningConclusion(path, conclusion): 当思考过程完成并得出结论时,调用此函数来记录最终结论。
  • explain-reasoning-process 工具的编排: 这个工具是用户或AI助手与分步推理功能交互的主要接口。
    • 调用 formatReasoningPath(path, modelsMap) 函数,将结构化的 ReasoningPath 对象转换成一段人类可读的文本,其中会清晰地列出每一步的描述、应用的思维模型名称及定义、证据等。
    • 调用 visualizeReasoningPath(path) 函数,生成一个包含节点和边的数据结构,这个数据结构可以被前端用来渲染成流程图或思维导图,直观地展示思考的脉络。
    • 输入: 客户端(如AI助手)会提供 problemDescription(对原始问题的描述)、一个 reasoningSteps 数组(用户或AI已经进行的多步思考,每一步都可能指定了描述、使用的模型ID、证据和置信度)以及最终的 conclusion
    • 处理流程:
    1. 服务器接收到这些输入后,首先调用 createReasoningPath 来创建一个新的推理路径实例,并将 problemDescription 作为第一个起点。
    2. 然后,它会遍历客户端传入的 reasoningSteps 数组。对于数组中的每一个元素(代表一个思考步骤),服务器会调用 addReasoningStep 函数,将这个步骤的细节(描述、模型ID、证据、置信度)添加到之前创建的推理路径中。
    3. 在所有步骤都添加完毕后,调用 setReasoningConclusion 将最终结论记录到推理路径中。
    4. 关联模型信息: 为了让推理过程更易懂,系统会收集所有在 reasoningSteps 中使用到的 modelIds。然后,它会从内存中已加载的 MODELS[lang] 缓存里查找这些ID对应的完整思维模型信息(如名称、定义等)。
    5. 格式化输出:
    6. 返回结果: 服务器最终会将格式化的文本、可视化数据以及原始的路径数据一起打包成JSON格式返回给客户端。

    实现分步的核心在于:

    • 结构化数据: 将抽象的思考过程转化为定义明确的 ReasoningStep 和 ReasoningPath 对象。
    • 逐步构建: 通过 addReasoningStep 这样的函数,允许推理路径被一步步地动态构建和扩展。
    • 外部驱动: explain-reasoning-process 工具充当了编排者的角色,它根据客户端(通常是AI助手或用户的输入)提供的分步信息来调用 reasoning_process.ts 中的函数,从而记录和组织这些步骤。AI助手本身在与用户交互时,可以根据用户的输入或自身的分析,将思考拆解成多个逻辑步骤,然后将这些步骤信息传递给“天机”服务器的这个工具。
    • 元数据丰富: 记录每一步应用的思维模型ID和证据,使得每一步的思考都有迹可循,并且能够与具体的理论知识(思维模型)关联起来。

这个系统的“学习系统”是如何实现的?主要发挥什么作用呢?

?

“天机”系统的“学习系统”主要通过 src/learning_capability.ts 文件来实现。它的核心作用是让“天机”服务器能够从用户的使用和反馈中学习,从而动态地改进其性能,特别是思维模型的推荐准确性和相关性

以下是这个学习系统的主要实现方式和作用:

  1. 核心数据结构与持久化存储:
  • UserFeedback (用户反馈): 定义了用户反馈的数据结构,包含反馈ID、时间戳、涉及的模型ID、使用场景(context)、反馈类型(如 helpfulnot_helpful)、评论、应用结果和改进建议等字段。
  • KnowledgeGap (知识缺口): 定义了知识缺口的数据结构,包含缺口ID、描述、检测次数、相关查询、可能的标签、建议的相关模型以及创建和更新时间。
  • ModelUsageStats (模型使用统计): 定义了每个模型的使用统计数据,包括模型ID、使用次数、平均有用性评分(基于正面和负面反馈计算)、正面反馈次数、负面反馈次数以及常见的应用场景摘要。
  • LearningSystemState (学习系统状态): 这是一个顶层接口,整合了上述所有数据:userFeedbacks 数组、knowledgeGaps 数组、一个将模型ID映射到其 ModelUsageStats 的记录(Record),以及最后更新时间戳。
  • 持久化存储:
    • 整个 LearningSystemState 对象被存储在项目根目录下的 data/learning_state.json 文件中。
    • loadLearningSystemState() 函数负责在服务器启动时从该JSON文件加载状态到内存中的 systemState 变量。如果文件不存在或加载失败,会使用默认的空状态并尝试保存。
    • saveLearningSystemState() 函数负责将内存中的 systemState 写回JSON文件,通常在记录新反馈或更新统计信息后异步调用。
  1. 学习系统的主要功能实现:
  • 记录用户反馈 (recordUserFeedback 函数):
    • 作用: 收集和处理用户对模型使用的反馈。
    • 实现:
    • 此功能通过 thinking_models_server.ts 中的 record-user-feedback 工具暴露给客户端。
  1. 接收模型ID、应用上下文、反馈类型等参数。
  2. 创建一个新的 UserFeedback 对象,并将其添加到 systemState.userFeedbacks 数组中。
  3. 更新相关模型的 ModelUsageStats:增加使用次数;根据反馈类型(如有帮助/有见解 vs. 无帮助/不正确/令人困惑)更新正面或负面反馈计数;重新计算平均有用性 (positiveCount / (positiveCount + negativeCount))。
  4. 记录使用上下文的摘要(前100个字符)到模型的 commonContexts 列表,并保留最近的5个。
  5. 如果反馈类型表明模型可能不适用或有问题(如 not_helpfulincorrectconfusing),则会调用 detectKnowledgeGap 函数。
  6. 异步调用 saveLearningSystemState() 保存更新后的状态。
  • 检测知识缺口 (detectKnowledgeGap 函数):
    • 作用: 根据用户查询和当前模型库的匹配情况,识别系统可能存在的知识盲点。
    • 实现:
    • 此功能通过 thinking_models_server.ts 中的 detect-knowledge-gap 工具暴露给客户端,也会在 recordUserFeedback 中被内部调用。
    1. 接收用户查询、当前查询匹配到的模型列表以及一个匹配阈值。
    2. 评估用户查询与 matchedModels 中模型的匹配度(使用 similarity_engine.ts 中的 calculateQueryMatch)。
    3. 如果所有匹配模型的得分都低于设定的 matchThreshold,则认为可能存在知识缺口。
    4. 系统会检查是否已存在描述相似的知识缺口。它会对比查询中的关键词与现有 KnowledgeGap 描述中的关键词的重合度。
    5. 如果找到相似的现有缺口,则增加其 detectionCount,更新时间戳,并将当前查询添加到其 relatedQueries 列表中。
    6. 如果未找到相似缺口,则创建一个新的 KnowledgeGap 对象,记录查询本身作为描述,并提取查询中的长词作为 possibleTags
    7. 异步调用 saveLearningSystemState()
  • 获取模型使用统计 (getModelUsageStats 函数):
    • 作用: 提供特定模型的使用数据。
    • 实现: 直接从 systemState.modelUsageStats 中查找并返回指定 modelId 的统计对象。
    • 此功能通过 thinking_models_server.ts 中的 get-model-usage-stats 工具暴露。该工具还会结合调用 getModelFeedbackHistory 来丰富返回信息。
  • 获取知识缺口列表 (getKnowledgeGaps 函数):
    • 作用: 返回系统中记录的知识缺口,按检测次数排序。
    • 实现: 对 systemState.knowledgeGaps 数组进行排序和切片。
    • 此功能主要被 analyze-learning-system 工具使用。
  • 获取模型反馈历史 (getModelFeedbackHistory 函数):
    • 作用: 检索特定模型的所有用户反馈记录。
    • 实现: 过滤 systemState.userFeedbacks 数组,找出包含指定 modelId 的反馈。
  • 分析模型使用模式 (analyzeModelUsage 函数):
    • 作用: 对整个学习系统的数据进行宏观分析,生成洞察。
    • 实现:
    • 此功能通过 thinking_models_server.ts 中的 analyze-learning-system 工具暴露。
    1. 汇总所有模型的 ModelUsageStats
    2. 找出最常用的模型(按 usageCount 排序)。
    3. 找出最有效的模型(按 averageHelpfulness 排序,且使用次数达到一定阈值,如3次)。
    4. 找出可能有问题的模型(负面反馈较多且使用次数达到阈值)。
    5. 返回包含这些分析结果以及反馈总数、知识缺口总数等统计信息的对象。
  • 基于学习调整模型推荐 (adjustModelRecommendations 函数):
    • 根据历史有效性调整分数:如果模型的 averageHelpfulness 较高(例如 > 0.7),则推荐分数会乘以一个增益因子(例如1.2);如果较低(例如 < 0.3),则乘以一个衰减因子(例如0.8)。
    • 检查当前查询上下文与模型 commonContexts 中的常见使用场景摘要的相似性。如果存在相关上下文,则推荐分数会再乘以一个增益因子(例如1.1)。
    • 获取该模型的 ModelUsageStats
    • 如果模型有统计数据且使用次数达到一定阈值(如3次):
    • 记录下分数调整的原因。
    • 作用: 这是学习系统最核心的价值体现之一。它利用已收集到的模型使用统计和反馈数据,来优化和个性化模型推荐结果。
    • 实现:
    • 此函数主要被 thinking_models_server.ts 中的 recommend-models-for-problem 工具在开启 use_learning_adjustment 时调用。
    1. 接收一个初始的推荐模型列表(包含模型ID和原始推荐分数)以及当前的查询上下文。
    2. 如果系统中的反馈数据量较少(例如少于5条),则直接返回原始推荐,不进行调整。
    3. 对于初始推荐列表中的每个模型:
    4. 返回调整后的模型列表,并按新的分数重新排序。

    学习系统的主要作用:

    1. 个性化推荐: 通过分析用户反馈和模型在特定场景下的表现,系统可以逐渐学习用户的偏好和哪些模型在哪些情境下更有效,从而提供更精准、更个性化的模型推荐。
    2. 模型库的自我完善:
    • 通过 detectKnowledgeGap,系统可以识别出知识库中可能存在的不足之处,为后续添加新模型或扩展现有模型提供方向。
    • 通过 analyzeModelUsage 和 get-model-usage-stats,可以发现哪些模型受欢迎、哪些模型可能存在问题或解释不清,从而指导模型内容的优化和迭代。
  • 提升用户体验: 随着学习数据的积累,系统推荐的模型会越来越贴合用户的实际需求,减少用户寻找合适模型的时间,提升解决问题的效率。
  • 数据驱动的改进: 为模型的开发者和维护者提供了关于模型实际应用效果的宝贵数据,使得模型的改进不再仅仅依赖理论,而是有了真实世界使用情况的支撑。
  • 动态适应: 使得“天机”系统不仅仅是一个静态的知识库,而是一个能够随着使用不断进化、越来越智能的思考辅助工具。

“检测知识缺口”是什么意思?它是如何实现的?

?

“检测知识缺口”(Detect Knowledge Gap)是“天机”学习系统中的一个重要功能,其实现在 src/learning_capability.ts 文件的 detectKnowledgeGap 函数中。

它的核心意思是:系统尝试判断用户的查询或遇到的问题,是否超出了当前思维模型库的覆盖范围。 换句话说,就是看“天机”里现有的思维模型能不能很好地解答或匹配用户提出的问题。如果不能,就认为可能存在一个“知识缺口”。

它是如何实现的呢?

我们可以把它想象成一个“知识雷达”:

  1. 接收信号(用户查询):
  • 当用户通过客户端(比如AI助手)向“天机”提问时,或者当用户反馈某个模型“没帮助”、“不正确”时,这个“检测知识缺口”的功能就可能被触发。
  • 它会拿到用户的原始查询语句(query)。
  • 扫描现有知识库(匹配模型):
    • 系统首先会尝试用现有的模型去匹配这个查询。具体来说,它会使用 src/similarity_engine.ts 里的 calculateQueryMatch 函数来计算用户查询和知识库中每个思维模型的“匹配分数”。这个分数代表了模型与查询的相近程度。
    • detectKnowledgeGap 函数会接收一个参数 matchedModels(代表初步匹配上的模型列表)和一个 matchThreshold(匹配阈值,默认0.5)。
  • 判断是否存在“盲区”(知识缺口):
    • 核心判断逻辑: 如果所有初步匹配到的模型的匹配分数都低于预设的 matchThreshold,系统就认为现有的模型库可能无法很好地覆盖用户提出的问题或概念。这就好比雷达扫描了一圈,发现这个方向上没有明确的目标。
    • 如果确实没有模型能达到足够的匹配度(即所有模型得分都低于阈值),那么系统就判定这里可能存在一个“知识缺口”。
  • 记录和描述“盲区”:
    • gapId: 缺口的唯一ID。
    • description: 通常就是用户的原始查询语句,作为这个知识缺口的描述。
    • detectionCount: 这个缺口被检测到的次数(如果之后又有类似的查询也被判定为缺口,这个计数会增加)。
    • relatedQueries: 记录所有导致检测到这个缺口的相关查询。
    • possibleTags: 从用户查询中提取一些关键词(比如长度超过3的词,最多5个),作为这个知识缺口可能的标签,方便以后归类或查找。
    • createdAtupdatedAt: 创建和更新的时间戳。
    • 如果检测到了知识缺口,系统会创建一个 KnowledgeGap 对象来记录它。这个记录包含:
  • 避免重复记录(合并相似缺口):
    • 在创建一个新的知识缺口记录之前,系统还会检查 systemState.knowledgeGaps 中是否已经存在一个描述相似的知识缺口。
    • 这里的“相似”判断比较简单:它会看新查询的关键词与已存缺口的描述或相关查询中的关键词是否有一定的重合度(例如,超过50%的关键词匹配)。
    • 如果找到了相似的现有缺口,就不会创建新的,而是更新现有缺口的 detectionCount 和 relatedQueries 等信息。
  • 持久化存储:
    • 无论是创建新的知识缺口还是更新现有的,最终都会通过 saveLearningSystemState() 函数将这些信息保存到 data/learning_state.json 文件中,以便长期跟踪和分析。

    这个功能的主要作用是什么呢?

    • 系统自我完善的输入: 识别出的知识缺口是系统未来改进的重要方向。开发团队或内容贡献者可以根据这些缺口来决定:
      • 是否需要添加新的思维模型到知识库中。
      • 是否需要扩展现有模型的标签、关键词或描述,以便更好地被用户发现。
    • 了解系统边界: 用户可以通过 detect-knowledge-gap 工具(它调用了 detectKnowledgeGap 函数)来主动探测系统在某个领域的知识覆盖情况。
    • 提升推荐质量的间接手段: 虽然它不直接调整推荐算法,但它记录下的信息可以为人工分析和模型库的扩充提供依据,从而间接提升未来推荐的覆盖面和准确性。
    • 用户需求洞察: 积累的知识缺口数据可以反映出用户群体当前比较关注但系统尚未很好满足的知识领域。

    简单来说,用费曼学习法解释:

    想象“天机”是一个图书馆,里面有很多关于“怎么思考”的书(思维模型)。

    1. 你来问问题: 你问了一个图书馆里可能没有直接答案的问题(比如“数字化营销环境下的产品发布策略与消费者心理学”)。
    2. 图书管理员(系统)去找书: 图书管理员会看看现有的书(思维模型)能不能回答你的问题。它会给每本书打个“相关分”。
    3. 发现没合适的书: 如果所有书的“相关分”都很低,都低于一个标准线(比如0.5分),图书管理员就会觉得:“哎呀,我们图书馆好像缺这方面的书!” 这就是“检测到知识缺口”了。
    4. 记录下来: 图书管理员会把你问的问题记在一个小本本上,标记为“待采购/待补充的书籍主题”,还会记下你问这个问题的次数,以及你用了哪些关键词。如果之前也有人问过类似的问题,管理员就会在原来的记录上添一笔,表示这个主题的书很多人需要。
    5. 以后改进: 将来图书馆进新书的时候,就会优先考虑这些被记录下来的“缺书主题”,这样图书馆的书就会越来越全,越来越能满足大家的需求。


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询