微信扫码
添加专属顾问
我要投稿
提出了MATEval框架,它能够提供详尽的诊断报告,提高了 LLM 生成文本评分的准确性和可靠性。该框架不仅加速了工业环境中的模型迭代,还提升了审查效率。
在多智能体框架中创新性地整合了自我反思和CoT方法,并在讨论结束后引入了反馈机制,以解决分歧并促进共识。
在两个英文和两个中文文本数据集上进行了全面实验。实验结果证明了该框架的有效性并且评估结果与人类评估的结果高度一致。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-07
腾讯混元干了件大事:Skill Graphs
2026-04-23
从可观测到可理解:用 UModel 构建 Agent 原生的代码知识图谱
2026-04-23
Ontological Engineering:基于PolarDB-PG智能本体引擎实现“数据驱动”到“决策中心”
2026-04-22
还在关注Palantir本体论吗!看看OntoFlow本体建模平台:从数据 -> 知识图谱 -> 本体 -> 决策的完整链路功能演示
2026-04-19
碎片知识终于不乱了!这款开源 AI 工具,把笔记转为知识图谱,还能本地部署!
2026-04-07
卡帕西没做完的,开源社区48小时搞定了!完全体知识库,token省70倍
2026-03-28
当 SAP 买下 Reltio:企业软件进入“上下文时代”
2026-03-26
告别 AI 胡说八道!这款开源神器把代码变成知识图谱,让 Cursor 和 Claude 彻底读懂你的项目
2026-02-20
2026-02-21
2026-02-23
2026-04-07
2026-02-20
2026-02-11
2026-03-26
2026-03-28
2026-04-19
2026-02-22