论文阅读:EMNLP Findings 2025 Agentic-ToM: Cognition-Inspired Agentic Processing For Enhancing Theory of

张开发
2026/4/8 12:45:29 15 分钟阅读

分享文章

论文阅读:EMNLP Findings 2025 Agentic-ToM: Cognition-Inspired Agentic Processing For Enhancing Theory of
总目录 大模型相关研究 2025版https://blog.csdn.net/WhiffeYF/article/details/142132328Agentic-ToM: Cognition-Inspired Agentic Processing For Enhancing Theory of Mind Reasoning in Large Language Modelshttps://arxiv.org/pdf/2502.00640v3该论文名由纽约大学阿布扎比分校等机构的研究人员Sneheel Sarangi、Chetan Talele和Hanan Salam共同撰写 。目前该论文已被自然语言处理领域的国际顶级会议EMNLP 2025的Findings子刊正式收录 。在人类的社交智能中“心理理论”Theory of Mind, ToM是一项基础且核心的能力它让我们能够理解他人的信念、欲望和意图 。随着大语言模型LLM越来越多地被融入复杂的交互系统中赋予它们这种能力变得尤为重要 。然而当前的大模型在处理复杂的换位思考、追踪他人心理状态变化时往往表现得力不从心 。为了突破这一瓶颈该论文从认知心理学中汲取灵感提出了一种创新的解决方案 。该论文提出了一种名为“Agentic-ToM”的全新方法其核心在于将大模型转化为智能体Agent并为其配备了受心理学启发的“认知工具” 。为了方便理解我们可以用一个生活中的通俗例子来讲讲这个方法假设小明把一块巧克力放在抽屉里然后离开了房间接着小红偷偷把巧克力转移到了冰箱里。如果你问AI“小明回来会去哪里找巧克力”普通的模型可能会因为拥有“上帝视角”而错误地回答“冰箱”。但是Agentic-ToM方法会让大模型主动调用“换位思考工具”屏蔽掉小红转移巧克力的信息只保留小明离开前看到的画面 。随后它会调用“心理状态建模工具”来分析小明的信念即小明依然认为巧克力在抽屉里 。通过这种像人类一样有意识的、一步步的结构化推理模型最终能得出正确的结论 。在实验评估阶段研究团队在HiToM、FANTOM和OpenToM三个不同维度的心理理论数据集上进行了严格测试 。结果证明无论是相比于直接回答Baseline还是思维链提示CoT该论文提出的Agentic-ToM方法都取得了显著的性能提升 。尤其是在需要多重复杂推理的任务中其优势更为明显 。这项研究在无需对模型进行特定任务修改的前提下大幅增强了大模型的社交理解能力 。

更多文章