OmniGameArena ：具有改进动态的VLM游戏代理的统一UE5基准

**摘要**
视觉语言模型（ VLM ）代理越来越多地部署在交互式游戏环境中。然而， VLM代理的游戏基准通常报告每个（代理，游戏）对的单次首次尝试得分，专注于单代理独奏游戏，并且缺乏用于评估异构代理类别（商业VLM ，开放式VLM和专业游戏策略）的统一协议。我们地址
👤 作者: Mingxian Lin, Shengju Qian, Yuqi Liu, Yi-Hua Huang, Yiyu Wang, Wei Huang, Yitang Li, Fan Zhang, Zeyu Hu, Lingting Zhu, Xin Wang, Xiaojuan Qi

---
🔗 **[OmniGameArena ：具有改进动态的VLM游戏代理的统一UE5基准](https://arxiv.org/abs/2606.09826v1)**

> OmniGameArena: A Unified UE5 Benchmark for VLM Game Agents with Improvement Dynamics
🏷️ 来源: ArXiv cs.AI
⏱️ 2026-06-09 14:00

OmniGameArena ：具有改进动态的VLM游戏代理的统一UE5基准

回复