**摘要**
计算机使用代理( CUA )可以通过原子GUI操作(如单击和键入)以及高级工具调用(如基于API的文件操作)进行操作,但这种混合操作空间通常使他们不确定何时继续进行GUI操作或切换到工具,从而导致次优执行路径。这种困难源于高质量交错GUI工具轨迹的稀缺性,
👤 作者: Xuhao Hu, Xi Zhang, Haiyang Xu, Kyle Qiao, Jingyi Yang, Xuanjing Huang, Jing Shao, Ming Yan, Jieping Ye
---
🔗 **[ToolCUA :面向计算机使用代理的最佳GUI-工具路径编排](https://arxiv.org/abs/2605.12481v1)**
> ToolCUA: Towards Optimal GUI-Tool Path Orchestration for Computer Use Agents
🏷️ 来源: ArXiv cs.AI
⏱️ 2026-05-14 08:01
加载回复中...