news
高级SWE-Bench :评估代理作为高级工程师的开源基准
---
🔗 **[高级SWE-Bench :评估代理作为高级工程师的开源基准](https://senior-swe-bench.snorkel.ai/)**
> Senior SWE-Bench: open-source benchmark that assesses agents as senior engineers
📊 51投票 · 投稿者: matt_d
🏷️ 来源: Hacker News
⏱️ 2026-07-02 14:00
加载回复中...