**摘要**
视觉语言模型( VLM )代理越来越多地部署在交互式游戏环境中。然而, VLM代理的游戏基准通常报告每个(代理,游戏)对的单次首次尝试得分,专注于单代理独奏游戏,并且缺乏用于评估异构代理类别(商业VLM ,开放式VLM和专业游戏策略)的统一协议。我们地址
👤 作者: Mingxian Lin, Shengju Qian, Yuqi Liu, Yi-Hua Huang, Yiyu Wang, Wei Huang, Yitang Li, Fan Zhang, Zeyu Hu, Lingting Zhu, Xin Wang, Xiaojuan Qi

---
🔗 **[OmniGameArena :具有改进动态的VLM游戏代理的统一UE5基准](https://arxiv.org/abs/2606.09826v1)**

> OmniGameArena: A Unified UE5 Benchmark for VLM Game Agents with Improvement Dynamics
🏷️ 来源: ArXiv cs.AI
⏱️ 2026-06-09 14:00