微信扫码
添加专属顾问
我要投稿
提出了MATEval框架,它能够提供详尽的诊断报告,提高了 LLM 生成文本评分的准确性和可靠性。该框架不仅加速了工业环境中的模型迭代,还提升了审查效率。
在多智能体框架中创新性地整合了自我反思和CoT方法,并在讨论结束后引入了反馈机制,以解决分歧并促进共识。
在两个英文和两个中文文本数据集上进行了全面实验。实验结果证明了该框架的有效性并且评估结果与人类评估的结果高度一致。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-03
基于 LLM 抽取与 Neo4j,从会议纪要构建自更新知识图谱
2026-02-03
Claude Code 用户福音!一键生成红楼梦、海贼王、灵笼人物关系图谱
2026-01-27
在大学里“知识图谱”,真的有人用吗?
2026-01-22
CoDe-KG:利用大语言模型和句子复杂度建模的自动化知识图谱构建
2026-01-16
面向本体质量的评估指标与方法探析
2026-01-14
Context Graph2025年最具代表性论文与技术进展汇总
2026-01-13
下一个万亿AI赛道!上下文图谱,才是AI创业的真正机会
2026-01-13
Context Graph
2025-12-31
2025-12-01
2025-11-24
2025-12-05
2025-11-13
2025-12-08
2025-12-04
2025-11-14
2025-12-02
2025-11-20