论文阅读：EMNLP Findings 2025 Agentic-ToM: Cognition-Inspired Agentic Processing For Enhancing Theory of

张开发

• 2026/4/8 12:45:29 • 15 分钟阅读

分享文章

论文阅读：EMNLP Findings 2025 Agentic-ToM: Cognition-Inspired Agentic Processing For Enhancing Theory of

总目录大模型相关研究 2025版https://blog.csdn.net/WhiffeYF/article/details/142132328Agentic-ToM: Cognition-Inspired Agentic Processing For Enhancing Theory of Mind Reasoning in Large Language Modelshttps://arxiv.org/pdf/2502.00640v3该论文名由纽约大学阿布扎比分校等机构的研究人员Sneheel Sarangi、Chetan Talele和Hanan Salam共同撰写。目前该论文已被自然语言处理领域的国际顶级会议EMNLP 2025的Findings子刊正式收录。在人类的社交智能中“心理理论”Theory of Mind, ToM是一项基础且核心的能力它让我们能够理解他人的信念、欲望和意图。随着大语言模型LLM越来越多地被融入复杂的交互系统中赋予它们这种能力变得尤为重要。然而当前的大模型在处理复杂的换位思考、追踪他人心理状态变化时往往表现得力不从心。为了突破这一瓶颈该论文从认知心理学中汲取灵感提出了一种创新的解决方案。该论文提出了一种名为“Agentic-ToM”的全新方法其核心在于将大模型转化为智能体Agent并为其配备了受心理学启发的“认知工具” 。为了方便理解我们可以用一个生活中的通俗例子来讲讲这个方法假设小明把一块巧克力放在抽屉里然后离开了房间接着小红偷偷把巧克力转移到了冰箱里。如果你问AI“小明回来会去哪里找巧克力”普通的模型可能会因为拥有“上帝视角”而错误地回答“冰箱”。但是Agentic-ToM方法会让大模型主动调用“换位思考工具”屏蔽掉小红转移巧克力的信息只保留小明离开前看到的画面。随后它会调用“心理状态建模工具”来分析小明的信念即小明依然认为巧克力在抽屉里。通过这种像人类一样有意识的、一步步的结构化推理模型最终能得出正确的结论。在实验评估阶段研究团队在HiToM、FANTOM和OpenToM三个不同维度的心理理论数据集上进行了严格测试。结果证明无论是相比于直接回答Baseline还是思维链提示CoT该论文提出的Agentic-ToM方法都取得了显著的性能提升。尤其是在需要多重复杂推理的任务中其优势更为明显。这项研究在无需对模型进行特定任务修改的前提下大幅增强了大模型的社交理解能力。

更多文章

前端开发 2026/4/8 12:45:16

mysql数据库命令集合

下载 Yum install -y mysql 启动 Systemctl start mysqld 给外部链接全部权限 grant all privileges on *.* to root192.168.11.%; 删除权限 Revoke all on 库.表 from ‘用户名’’ip’； 删除用户 Drop user 用户名’%’ 刷新权限 Flush privileges&#xff1…

张开发

前端开发 2026/4/8 12:44:25

缺陷预防：比发现Bug更重要的事

在软件质量保障的广袤版图上，测试工程师的角色常被描绘成“缺陷猎人”——他们运用各种技术与工具，在代码的丛林中搜寻潜藏的Bug。然而，随着软件交付节奏的不断加快和系统复杂性的指数级增长，一个更为根本的理念正逐渐成为行业共识…

张开发

前端开发 2026/4/8 12:43:24

如何用ThreeFingersDragOnWindows实现Windows精准触控板三指拖拽：从Mac用户到Windows效率专家的平滑过渡

如何用ThreeFingersDragOnWindows实现Windows精准触控板三指拖拽：从Mac用户到Windows效率专家的平滑过渡【免费下载链接】ThreeFingersDragOnWindows Enables macOS-style three-finger dragging functionality on Windows Precision touchpads. 项目地址: https…

张开发

前端开发 2026/4/8 12:40:15

从PyTorch到Android：YOLOv11模型轻量化部署与Qt实战避坑指南

1. 为什么选择Qt for Android部署YOLOv11？ 对于习惯C开发的工程师来说，用Qt框架做Android端部署是个非常务实的选择。我去年接手一个农业巡检项目时，需要在无人机平板上实时检测作物病害，当时尝试过Android Studio方案&#xff0c…

张开发

前端开发 2026/4/8 12:39:07

ccmusic-database保姆级教学：examples示例音频测试+结果验证方法

ccmusic-database保姆级教学：examples示例音频测试结果验证方法你是不是也遇到过这样的问题：下载了一个音乐分类模型，想试试效果，但不知道该怎么测试？或者测试了几个音频，但不确定结果对不对，…

张开发

前端开发 2026/4/8 12:39:01

MS-SWIFT实战：5分钟搞定Qwen2.5-7B-Instruct的LoRA微调（附完整参数解析）

MS-SWIFT实战：5分钟高效LoRA微调Qwen2.5-7B-Instruct全流程指南当开发者第一次接触大模型微调时，往往会被复杂的参数配置和漫长的训练过程劝退。而MS-SWIFT框架的出现，就像给这个领域注入了一剂强心针——它让原本需要数小时才能完成的微调任…

张开发

前端开发 2026/4/8 12:37:55

【Python入门速学】2.7. for循环

2.7.1. 初识 for 循环在上一个课程中，我们学习了 while 循环，它可以在不知道执行次数的情况下重复运行某个代码块。但如果你知道需要执行的次数，那么使用 for 循环会更合适。 2.7.2. 什么是 for 循环？ for 循环是一种编程结构&a…

张开发

前端开发 2026/4/8 12:34:21

域名 xyz 注册后如何进行 SEO 优化

域名 xyz 注册后如何进行 SEO 优化在互联网时代，拥有一个优质的域名是每个网站的基础。特别是在选择一个新的域名时，我们常常会倾向于选择一些独特而有记忆点的域名，比如使用“xyz”这样的字符。仅仅注册一个域名并不能保证你的网站能在搜索…

张开发

前端开发 2026/4/8 12:34:03

如何快速掌握pgloader：PostgreSQL数据迁移的终极实战指南

如何快速掌握pgloader：PostgreSQL数据迁移的终极实战指南【免费下载链接】pgloader Migrate to PostgreSQL in a single command! 项目地址: https://gitcode.com/gh_mirrors/pg/pgloader pgloader是一款专为PostgreSQL设计的强大数据迁移工具，它…

张开发

前端开发 2026/4/8 12:32:38

解决经典游戏兼容性难题：DDrawCompat工具的创新方案

解决经典游戏兼容性难题：DDrawCompat工具的创新方案【免费下载链接】DDrawCompat DirectDraw and Direct3D 1-7 compatibility, performance and visual enhancements for Windows Vista, 7, 8, 10 and 11 项目地址: https://gitcode.com/gh_mirrors/dd/DDrawCom…

张开发

前端开发 2026/4/8 12:31:55

Omaha与其他更新框架对比分析：Squirrel、Sparkle等方案优劣

Omaha与其他更新框架对比分析：Squirrel、Sparkle等方案优劣【免费下载链接】omaha Google Update for Windows 项目地址: https://gitcode.com/gh_mirrors/om/omaha 在当今软件生态系统中，自动更新框架已成为现代应用程序的必备组件。作为Google…

张开发

前端开发 2026/4/8 12:30:54

DeepSeek卡顿解决方案：探索开源生态下的优质替代平台

1. DeepSeek卡顿背后的技术真相最近不少朋友都在抱怨DeepSeek用起来特别卡，我自己实测也发现响应速度明显变慢。这其实是个典型的"幸福的烦恼"——短短一个月用户量突破1.25亿，服务器压力可想而知。更糟的是，还遭遇了不明来源的DD…

张开发

论文阅读：EMNLP Findings 2025 Agentic-ToM: Cognition-Inspired Agentic Processing For Enhancing Theory of

最新文章

OmAgent开源贡献指南：如何为这个多模态AI框架添砖加瓦

Node-API插件开发完整教程：实现跨版本ABI稳定性

MLOps平台：MLflow、Kubeflow、SageMaker——软件测试从业者的选型与验证指南

cgm-remote-monitor API完全参考：开发者必备的血糖数据集成指南

Outlook邮箱爆满无法接收邮件怎么办？一篇文章教你用“归档”快速释放空间

C# OPC UA客户端配置全链路实战（从证书生成到订阅激活的12个关键节点）

推荐文章

AVR长周期看门狗库：突破8秒限制实现毫秒级精准复位与睡眠唤醒

并发控制原理与实现：从进程线程到现代并发编程

HunyuanVideo-Foley开源大模型实战：基于Transformers/Accelerate推理优化

小步快跑・像CPU一样调度大脑高并发——东方仙盟・阿雪心学

STM8 Bootloader开发与固件远程升级实践

（复现）基于自适应滑模控制（ASMC）和神经网络容错控制的主从式无人机编队控制研究（Matlab代码实现）

相关文章

深入解析ZeroMQ inproc：线程间通信的高效实现与性能优势

BewlyBewly终极指南：打造高效个性化的B站浏览体验

IDM激活脚本架构设计：基于注册表锁定机制的99%成功率激活方案

Sulpho-Methyltetrazine-NHS ester，磺化甲基四嗪-琥珀酰亚胺酯的结构特点与功能

3步精通Zotero OCR：从安装到高效文本识别

OpCore-Simplify：驯服硬件兼容性的自动化引擎

分享文章

更多文章

mysql数据库命令集合

缺陷预防：比发现Bug更重要的事

如何用ThreeFingersDragOnWindows实现Windows精准触控板三指拖拽：从Mac用户到Windows效率专家的平滑过渡

从PyTorch到Android：YOLOv11模型轻量化部署与Qt实战避坑指南

ccmusic-database保姆级教学：examples示例音频测试+结果验证方法

MS-SWIFT实战：5分钟搞定Qwen2.5-7B-Instruct的LoRA微调（附完整参数解析）

【Python入门速学】2.7. for循环

域名 xyz 注册后如何进行 SEO 优化

如何快速掌握pgloader：PostgreSQL数据迁移的终极实战指南

解决经典游戏兼容性难题：DDrawCompat工具的创新方案

Omaha与其他更新框架对比分析：Squirrel、Sparkle等方案优劣

DeepSeek卡顿解决方案：探索开源生态下的优质替代平台