微信扫码
添加专属顾问
我要投稿
拥有“心智理论”,可能是让AI摆脱“知识库“、成为伙伴或者服务者的第一步。然而,“情商”这个人类从小就开始发展的基本能力,最先进的AI系统拥有吗?
12月,Meta的研究团队发布了一篇名为《Explore Theory-of-Mind: Program-Guided Adversarial Data Generation for Theory of Mind Reasoning》的研究报告。
“安娜把蛋糕放在红盒子里。当比尔进来时,她说:'蛋糕在蓝盒子里'。比尔相信了她的话。”这考察AI是否能区分:客观事实、主观信念、故意误导
这说明,动作发生的越多,AI越记不住人物的认知状态更新。
这些最先进的AI,都没啥情商。
其实人类的情商一般也是在社会化过程中慢慢培养出来的。那AI是不是也可以被培养呢?
沿着这个思路,研究人员把ExploreToM改造成了一所专门培养AI社交认知能力的工具。他们收集了将近8万个特制的“练习题”——包括ExploreToM生成的故事、问题和答案。用这些材料,他们开始“补课”训练Llama-3.1 8B模型。
训练效果证明了他们的猜测,经过训练的AI模型在多个标准测试中都有显著进步。在最具代表性的AI心智能力测试ToMi中,模型的分数提高了27分。
经过这样系统的训练,AI在社交认知能力上取得了显著进步。在基础任务中,正确率达到了75-80%,相当于及格线以上的成绩。但是在更复杂的任务中,比如理解多重嵌套信念(确认A觉得B觉得......)这类问题时,表现仍然不够理想,正确率仅有30-35%。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-14
客服革命:多模态AI正在解决那些“说不清”的难题
2025-12-12
深度复盘:AI Agent 总是答非所问?可能你从第一行“意图定义”就错了
2025-12-11
钉钉8.1.10全新版本上线 职场沟通有了“AI嘴替”
2025-12-09
声网对话式 AI Studio 零代码也能快速开发对话式 Agent
2025-12-04
雇佣过目即忘的天才:为什么企业级AI总在浪费钱?| 甲子光年
2025-11-27
Agentic AI 全栈创新:从模型到治理,开启智能化落地新路径
2025-11-26
让AI评测AI:构建智能客服的自动化运营Agent体系
2025-11-22
客服领域AI Startup领头羊Sierra凭啥估值100亿美金?
2025-09-20
2025-10-30
2025-11-17
2025-11-12
2025-11-22
2025-11-26
2025-10-25
2025-10-28
2025-10-28
2025-10-31
2025-11-22
2025-11-17
2025-11-10
2025-11-02
2025-08-27
2025-08-25
2025-08-23
2025-08-08