**摘要**
人工智能代理越来越多地部署在动态的开放式环境中,这些环境需要在新信息到达时对其进行调整。为了有效地衡量现实用例的这种能力,我们建议构建接地模拟,按照真实世界事件发生的顺序重放它们。我们构建FutureSim ,让客服代表在互动时预测超出知识界限的世界事件
👤 作者: Shashwat Goel, Nikhil Chandak, Arvindh Arun, Ameya Prabhu, Steffen Staab, Moritz Hardt, Maksym Andriushchenko, Jonas Geiping

---
🔗 **[FutureSim :重播世界事件以评估自适应代理](https://arxiv.org/abs/2605.15188v1)**

> FutureSim: Replaying World Events to Evaluate Adaptive Agents
🏷️ 来源: ArXiv cs.AI
⏱️ 2026-05-16 08:00