免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

57分钟、6次交互、上千行深度思考!GLM-5从0到1开发因果关系图谱抽取及可视化系统实录

发布日期:2026-02-12 12:05:40 浏览次数: 1526
作者:老刘说NLP

微信搜一搜,关注“老刘说NLP”

推荐语

GLM-5开源大模型震撼发布,57分钟构建因果图谱系统展现国产AI硬实力!

核心内容:
1. GLM-5技术参数与开源优势解析
2. 因果图谱系统开发全流程实录
3. 国产大模型在复杂推理任务上的突破性表现

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

今天,GLM-5正式上线并在 Hugging Face 与 ModelScope 平台同步开源,参数从 355B(激活 32B)扩展至 744B(激活 40B),预训练数据从 23T 提升至 28.5T,模型权重遵循 MIT License。

我们可以感觉到,最近硅谷大模型的风向已然转变Opus4.6和GPT-5.3都不再主打“一句话生成网页”这类炫技式能力,而是全面转向AgenticCoding——让AI真正像工程师一样,沉下心来啃硬骨头、做长链路攻坚

也就是说,2026年编程大模型正在从“能写代码”进阶为“能构建系统”

目前,被大家奉为终极解决方案的“Claude Opus 4.5/4.6”和“GPT-5.3”虽然好用,但不是国产,接入麻烦,很贵,还不开源。而GLM-5的开源,是一场及时雨。

周围的朋友测试后,直呼“国产模型摸到了Opus的阶段!”,这里直接echo一下。

最近,Seedance 2.0 确实证明了中国在视频生成领域已跻身全球第一梯队,而GLM-5则在AI编程等复杂推理能力上有了它的方案

为啥这么说,起因是这样的,老刘一直在做知识图谱与大模型相关方向,而因果关系是知识图谱领域的一个十分重要的主题,给定一段文本,将文本中的因果关系对抽出来,形成知识图谱,是用于因果推理、事件预测的重要手段。

而关于这块,老刘有一个事件关系抽取的开源项目CausalityEventExtraction(https://github.com/liuhuanyong/CausalityEventExtraction),基于因果关系知识库的因果事件图谱实验项目,本项目罗列了因果显式表达的几种模式,基于这种模式和大规模语料,再经过融合等操作,可形成因果事件图谱。

虽然是几年前的项目,但这个项目没有接入在线url进行网页抽取的能力,并且缺乏界面上的展示,比如融合、对齐的进度以及可交互的可视化能力

因此,GLM-5来了,有个突发奇想的IDEA,既然如此牛逼,那就来试一下,搞起!

先说下结论,耗时57分钟【这是一个标准的长程的大模型生成任务了】,通过迭代交互多个版本,GLM-5给我实现了一个完整的因果知识图谱抽取系统。

它成功构建了一个仅包含单个HTML文件的因果知识图谱系统,并且代码只有657行【足够精简】。

无需安装,无需服务器,双击即用,却集成了URL 智能抓取、30+种因果模式匹配、Levenshtein 实体归一化算法、力导向图谱可视化等核心功能。

结果既然如此,我觉得,跟GLM-5交互的整个历程很有趣,这其实也说明了一次人机交互的过程,开发过程也是这样的,交互、确认,拿到最终结果

一、Round1:初次交互,一次性输出可用结果

直接在浏览器中输入https://chat.z.ai/,开始搞,充当了下prompt 工程师的角色,直接提示给GLM-5,告诉我要的需求:

随后,GLM-5开始进入角色:

做用户意图理解,用户想要一个因果知识图谱可视化界面,功能包括:输入文本、使用正则表达式抽取因果对(原因-结果)、以图谱形式展示因果关系。我需要:设计尽可能多的因果模式规则(中文)、实现文本解析和因果抽取、创建一个漂亮的图谱可视化前端,并且列举了一些规则。

然后开始编写:

最终直接可用:还给出了示例,输入之后可以直接抽取,展示抽取的结果、可视化图谱以及对应的统计数据【因果对、节点数、匹配模式

这是一个初步版本,已经可以直接用了,但是还不满足,可以继续优化。

二、Round2:优化迭代,知识图谱技术理解挑战

抽取的效果跟抽取算法相关,因此,可以进一步的进行抽取优化,所以,我进一步地进行发问:

“但是我发现,有些抽取其实并不是很好,比如存在一些跨句的因果问题,这个时候,你是不是要考虑先对长文本进行切句呀。或者同一个句子都走一遍这些模式呢?因为一个句子中可能存在多个因果对。此外,有的句子抽取出来的原因或者结果部分虽然长得有些字符不一样,但是意思一样,你可以实现一个简单的编辑距离算法,然后合并一下。这是知识图谱抽取的必然阶段呢?”

GLM-5开始进行深度思考,化身为知识图谱行家,构建流程:实体抽取 → 实体对齐/归一化 → 关系抽取 → 知识融合,提出要需要重构代码,加入:句子切分模块、对每个句子进行因果抽取、实现编辑距离算法、基于相似度进行节点合并。

最终给出的方案中自行实现了句子切分、编辑距离算法、实体归一化流程算法,并且很贴心的给出了可配置的阈值、实时预览合并效果和日志【这个很有工程思维!!】

随后,一顿输出开始了,也是一把过

将网页:https://zh.wikipedia.org/wiki/汶川大地震的网页内容作为文本复制进去,结果秒出:

因果关系抽取结果:

进一步的把抽取、归一化、图谱节点统计、切句结果、因果对等中间结果给整出来了。

三、Round3:能力升级-打通网页抓取、解析到抽取

上述两个步骤,一把过,已经可以支持人工输入对应的文本进行抽取的,开始进一步加大难度

新的要求:我不想输入一个文本,因为复制粘贴太麻烦,你除了支持文本输入,还能不能支持url 输入啊,我给一个特定的网页,你将这个网页中的文本进行解析,解析成文本,然后再做因果抽取呀

随后,展开了长达90行的思考:望支持 URL 输入而不仅仅是文本输入。目标是提供网页 URL,抓取/获取内容,解析文本,然后执行因果抽取。并且很专业的给出建议:浏览器环境中的直接跨域请求(CORS)通常会被阻止。前端 JavaScript 无法直接获取任意第三方 URL(如 https://example.com/news)并读取其 HTML 内容,除非该服务器允许(这很罕见),或者使用代理。进行了详尽的分析。

并最终给出技术方案:

一顿输出之后,开测:

输入文本,没问题,输入网址链接:https://zh.wikipedia.org/wiki/魏则西事件,结果是:抓取成功、解析错误:

错误代码: “null is not an object (evaluating 'contentArea.querySelectorAll')”

此时,考研模型的degbug纠错能力到了,直接让其debug,开始了长达201行的反思之路:

其通过观察请求的html日志,然后进行修改:

最后给出修复方案,重新修正代码,代码量还是挺大的,长达1387行:

继续测试:依旧输入输入网址链接:https://zh.wikipedia.org/wiki/魏则西事件,结果是加载旧错误,还不如第一次。

应该是模型想复杂了,继续人工交涉,让其简单些,直接提出需求:简单些?通用的抓取就好了。通用解析。不需要走什么代理。

GLM-5接收到指令后,继续反思,情绪价值给满,又一次完成了105 行的思考,并且在思考过程中,对之前的上下文日志进行回顾。

但是,通用解析这个本身就很难,直接找到一个解决方案:

牛的,具体jina的捷径都给找到了【这种可以极大的提高网页解析的准确性和通用性】,给出了最终版本的方案:

**去掉复杂的代理,移除了复杂的 HTML DOMParser 逻辑,利用 r.jina.ai 这个优秀的开源服务,它能直接把任意网页(包括百度百科、维基百科)转换成纯净的文本,而且天然支持跨域,不需要你自己去解析 HTML。

最后,代码重刷,可以解析了,但是这个版本过于简单,把之前的因果抽取模式进行缩减了,因此,再次让其进行修正:

GLM-5,在完成49行深度思考后,给出了最终的方案

注意:在增加功能的情况下,代码成功执行,并且代码量由之前的1387行缩减到658行,压缩超过50% 

讲html代码下载到本地,用浏览器打开,输入url:https://zh.wikipedia.org/wiki/汶川大地震,成功地得到了如下结果:

这就是我想要的最终效果,完成URL抓取→正文解析→因果抽取→实体归一化的完整流程,支持文本输入、支持url抓取,抓取后对网页进行自动解析并展示文本,可以设定合并阈值、对处理的句子、抽取的因果对、合并对齐的数量、图谱节点的数量进行统计、并且将抽取的因果对和整个图图谱的可视化展示【可拖动】,这都是在这一个html文件中完成的!!

整个过程结束,没有人工写一行代码,但生成了一个无需安装,无需服务器,双击即用,却集成了URL 智能抓取、30+种因果模式匹配、Levenshtein 实体归一化算法、力导向图谱可视化等核心功能。

写在最后

在这长达57分钟的这个系统开发里,人机交互6次,累计生成代码几千行、深度思考上千行,从0到1地完成了一个代码简洁的因果事件图谱自动抽取与可视化系统!!这是典型的Agentic任务实现范式,其任务本身需要思考和规划,强调“慢思考,高质量”

当然,也有一些其他的朋友有测试过GLM-5,他们认为,如果你需要一个能在本地帮你干脏活、累活、大活的系统架构师【这个架构师的意思是经过长时间的思考、推理、然后对一个任务有自己的理解,如本例子中的因果抽取、协调网页抓取、解析到整个流程】,GLM-5都展现出较强的能力,开源界的推荐选择,可以是平民版的 Opus”!

对了,结尾最后一句不得不要说下,哈哈,之前五折买的coding plan max 顿时觉得是超值的投资!

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询