我要投稿

57分钟、6次交互、上千行深度思考！GLM-5从0到1开发因果关系图谱抽取及可视化系统实录

发布日期：2026-02-12 12:05:40 浏览次数： 1526

作者：老刘说NLP

微信搜一搜，关注“老刘说NLP”

今天，GLM-5正式上线并在 Hugging Face 与 ModelScope 平台同步开源，参数从 355B（激活 32B）扩展至 744B（激活 40B），预训练数据从 23T 提升至 28.5T，模型权重遵循 MIT License。

我们可以感觉到，最近硅谷大模型的风向已然转变，Opus4.6和GPT-5.3都不再主打“一句话生成网页”这类炫技式能力，而是全面转向AgenticCoding——让AI真正像工程师一样，沉下心来啃硬骨头、做长链路攻坚。

也就是说，2026年编程大模型正在从“能写代码”进阶为“能构建系统”。

目前，被大家奉为终极解决方案的“Claude Opus 4.5/4.6”和“GPT-5.3”虽然好用，但不是国产，接入麻烦，很贵，还不开源。而GLM-5的开源，是一场及时雨。

周围的朋友测试后，直呼“国产模型摸到了Opus的阶段！”，这里直接echo一下。

最近，Seedance 2.0 确实证明了中国在视频生成领域已跻身全球第一梯队，而GLM-5则在AI编程等复杂推理能力上有了它的方案。

为啥这么说，起因是这样的，老刘一直在做知识图谱与大模型相关方向，而因果关系是知识图谱领域的一个十分重要的主题，给定一段文本，将文本中的因果关系对抽出来，形成知识图谱，是用于因果推理、事件预测的重要手段。

而关于这块，老刘有一个事件关系抽取的开源项目：CausalityEventExtraction（https://github.com/liuhuanyong/CausalityEventExtraction），基于因果关系知识库的因果事件图谱实验项目，本项目罗列了因果显式表达的几种模式，基于这种模式和大规模语料，再经过融合等操作，可形成因果事件图谱。

虽然是几年前的项目，但这个项目没有接入在线url进行网页抽取的能力，并且缺乏界面上的展示，比如融合、对齐的进度以及可交互的可视化能力！

因此，GLM-5来了，有个突发奇想的IDEA，既然如此牛逼，那就来试一下，搞起！

先说下结论，耗时57分钟【这是一个标准的长程的大模型生成任务了】，通过迭代交互多个版本，GLM-5给我实现了一个完整的因果知识图谱抽取系统。

它成功构建了一个仅包含单个HTML文件的因果知识图谱系统，并且代码只有657行【足够精简】。

无需安装，无需服务器，双击即用，却集成了URL 智能抓取、30+种因果模式匹配、Levenshtein 实体归一化算法、力导向图谱可视化等核心功能。

结果既然如此，我觉得，跟GLM-5交互的整个历程很有趣，这其实也说明了一次人机交互的过程，开发过程也是这样的，交互、确认，拿到最终结果。

一、Round1：初次交互，一次性输出可用结果

直接在浏览器中输入https://chat.z.ai/，开始搞，充当了下prompt 工程师的角色，直接提示给GLM-5，告诉我要的需求：

随后，GLM-5开始进入角色：

做用户意图理解，用户想要一个因果知识图谱可视化界面，功能包括：输入文本、使用正则表达式抽取因果对（原因-结果）、以图谱形式展示因果关系。我需要：设计尽可能多的因果模式规则（中文）、实现文本解析和因果抽取、创建一个漂亮的图谱可视化前端，并且列举了一些规则。

然后开始编写：

最终直接可用：还给出了示例，输入之后可以直接抽取，展示抽取的结果、可视化图谱以及对应的统计数据【因果对、节点数、匹配模式】

这是一个初步版本，已经可以直接用了，但是还不满足，可以继续优化。

二、Round2：优化迭代，知识图谱技术理解挑战

抽取的效果跟抽取算法相关，因此，可以进一步的进行抽取优化，所以，我进一步地进行发问：

“但是我发现，有些抽取其实并不是很好，比如存在一些跨句的因果问题，这个时候，你是不是要考虑先对长文本进行切句呀。或者同一个句子都走一遍这些模式呢？因为一个句子中可能存在多个因果对。此外，有的句子抽取出来的原因或者结果部分虽然长得有些字符不一样，但是意思一样，你可以实现一个简单的编辑距离算法，然后合并一下。这是知识图谱抽取的必然阶段呢？”

GLM-5开始进行深度思考，化身为知识图谱行家，构建流程：实体抽取 → 实体对齐/归一化 → 关系抽取 → 知识融合，提出要需要重构代码，加入：句子切分模块、对每个句子进行因果抽取、实现编辑距离算法、基于相似度进行节点合并。

最终给出的方案中自行实现了句子切分、编辑距离算法、实体归一化流程算法，并且很贴心的给出了可配置的阈值、实时预览合并效果和日志【这个很有工程思维！！】

随后，一顿输出开始了，也是一把过。

将网页：https://zh.wikipedia.org/wiki/汶川大地震的网页内容作为文本复制进去，结果秒出：

因果关系抽取结果：

进一步的把抽取、归一化、图谱节点统计、切句结果、因果对等中间结果给整出来了。

三、Round3：能力升级-打通网页抓取、解析到抽取

上述两个步骤，一把过，已经可以支持人工输入对应的文本进行抽取的，开始进一步加大难度！

新的要求：我不想输入一个文本，因为复制粘贴太麻烦，你除了支持文本输入，还能不能支持url 输入啊，我给一个特定的网页，你将这个网页中的文本进行解析，解析成文本，然后再做因果抽取呀。

随后，展开了长达90行的思考：望支持 URL 输入而不仅仅是文本输入。目标是提供网页 URL，抓取/获取内容，解析文本，然后执行因果抽取。并且很专业的给出建议：浏览器环境中的直接跨域请求（CORS）通常会被阻止。前端 JavaScript 无法直接获取任意第三方 URL（如 https://example.com/news）并读取其 HTML 内容，除非该服务器允许（这很罕见），或者使用代理。进行了详尽的分析。

并最终给出技术方案：

一顿输出之后，开测：

输入文本，没问题，输入网址链接：https://zh.wikipedia.org/wiki/魏则西事件，结果是：抓取成功、解析错误：

错误代码: “null is not an object (evaluating 'contentArea.querySelectorAll')”

此时，考研模型的degbug纠错能力到了，直接让其debug，开始了长达201行的反思之路：

其通过观察请求的html日志，然后进行修改：

最后给出修复方案，重新修正代码，代码量还是挺大的，长达1387行：

继续测试：依旧输入输入网址链接：https://zh.wikipedia.org/wiki/魏则西事件，结果是加载旧错误，还不如第一次。

应该是模型想复杂了，继续人工交涉，让其简单些，直接提出需求：简单些？通用的抓取就好了。通用解析。不需要走什么代理。

GLM-5接收到指令后，继续反思，情绪价值给满，又一次完成了105 行的思考，并且在思考过程中，对之前的上下文日志进行回顾。

但是，通用解析这个本身就很难，直接找到一个解决方案：

牛的，具体jina的捷径都给找到了【这种可以极大的提高网页解析的准确性和通用性】，给出了最终版本的方案：

**去掉复杂的代理，移除了复杂的 HTML DOMParser 逻辑，利用 r.jina.ai 这个优秀的开源服务，它能直接把任意网页（包括百度百科、维基百科）转换成纯净的文本，而且天然支持跨域，不需要你自己去解析 HTML。

最后，代码重刷，可以解析了，但是这个版本过于简单，把之前的因果抽取模式进行缩减了，因此，再次让其进行修正：

GLM-5，在完成49行深度思考后，给出了最终的方案：

注意：在增加功能的情况下，代码成功执行，并且代码量由之前的1387行缩减到658行，压缩超过50% 。

讲html代码下载到本地，用浏览器打开，输入url：https://zh.wikipedia.org/wiki/汶川大地震，成功地得到了如下结果：

这就是我想要的最终效果，完成URL抓取→正文解析→因果抽取→实体归一化的完整流程，支持文本输入、支持url抓取，抓取后对网页进行自动解析并展示文本，可以设定合并阈值、对处理的句子、抽取的因果对、合并对齐的数量、图谱节点的数量进行统计、并且将抽取的因果对和整个图图谱的可视化展示【可拖动】，这都是在这一个html文件中完成的！！

整个过程结束，没有人工写一行代码，但生成了一个无需安装，无需服务器，双击即用，却集成了URL 智能抓取、30+种因果模式匹配、Levenshtein 实体归一化算法、力导向图谱可视化等核心功能。

写在最后

在这长达57分钟的这个系统开发里，人机交互6次，累计生成代码几千行、深度思考上千行，从0到1地完成了一个代码简洁的因果事件图谱自动抽取与可视化系统！！这是典型的Agentic任务实现范式，其任务本身需要思考和规划，强调“慢思考，高质量”。

当然，也有一些其他的朋友有测试过GLM-5，他们认为，如果你需要一个能在本地帮你干脏活、累活、大活的系统架构师【这个架构师的意思是经过长时间的思考、推理、然后对一个任务有自己的理解，如本例子中的因果抽取、协调网页抓取、解析到整个流程】，GLM-5都展现出较强的能力，开源界的推荐选择，可以是平民版的 Opus”！

对了，结尾最后一句不得不要说下，哈哈，之前五折买的coding plan max 顿时觉得是超值的投资！