微信扫码
添加专属顾问
我要投稿
拥有“心智理论”,可能是让AI摆脱“知识库“、成为伙伴或者服务者的第一步。然而,“情商”这个人类从小就开始发展的基本能力,最先进的AI系统拥有吗?
12月,Meta的研究团队发布了一篇名为《Explore Theory-of-Mind: Program-Guided Adversarial Data Generation for Theory of Mind Reasoning》的研究报告。
“安娜把蛋糕放在红盒子里。当比尔进来时,她说:'蛋糕在蓝盒子里'。比尔相信了她的话。”这考察AI是否能区分:客观事实、主观信念、故意误导
这说明,动作发生的越多,AI越记不住人物的认知状态更新。
这些最先进的AI,都没啥情商。
其实人类的情商一般也是在社会化过程中慢慢培养出来的。那AI是不是也可以被培养呢?
沿着这个思路,研究人员把ExploreToM改造成了一所专门培养AI社交认知能力的工具。他们收集了将近8万个特制的“练习题”——包括ExploreToM生成的故事、问题和答案。用这些材料,他们开始“补课”训练Llama-3.1 8B模型。
训练效果证明了他们的猜测,经过训练的AI模型在多个标准测试中都有显著进步。在最具代表性的AI心智能力测试ToMi中,模型的分数提高了27分。
经过这样系统的训练,AI在社交认知能力上取得了显著进步。在基础任务中,正确率达到了75-80%,相当于及格线以上的成绩。但是在更复杂的任务中,比如理解多重嵌套信念(确认A觉得B觉得......)这类问题时,表现仍然不够理想,正确率仅有30-35%。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-30
Freshworks财报透视AI企业应用:职能自动化、AI客服为刚需类别,AI采用仍处于“早期采纳者”阶段!
2025-04-29
基于私域场景的新一代大模型客服可以玩出什么花样?
2025-04-29
效率提升300%!使用ChatWiki+DeepSeek打造升级版智能客服|干货分享
2025-04-27
AI银行进化论 | 基于大模型能力打造新一代智能客服
2025-04-24
Notion 新出的 AI 智能邮箱,正在偷偷解决打工人的「邮箱分类」焦虑……
2025-04-22
为什么一定要做Agent智能体?
2025-04-18
Dify/Dify+MCP/n8n 怎么选?3 类企业防信息孤岛实战指南(附避坑案例)
2025-04-17
WhatsApp MCP:从智能回复到工具调用,MCP激活即时通讯AI交互全新用法!
2024-05-08
2024-07-22
2025-02-09
2024-08-09
2024-06-30
2024-07-14
2024-09-07
2024-10-18
2024-03-31
2024-10-16