---
**正文**
长篇电视剧对全面的视频理解提出了巨大的挑战,其中破译复杂的故事情节通常依赖于\ textbf {speaker recognition} ,即准确地将每个口头话语归因于其各自的角色的任务。在本文中,我们通过两个主要贡献来推进这一领域。( 1 )我们引入了\ textbf {DramaSR-532K} ,这是一个大规模的基准
---
🔗 **[推理法学硕士提高长篇电视剧演讲者的认知度](https://arxiv.org/abs/2607.02504v1)**
> Reasoning LLM Improves Speaker Recognition in Long-form TV Dramas
🏷️ 来源: ArXiv cs.AI
👤 作者: Yuxuan Li, Lingxi Xie, Xinyue Huo, Jihao Qiu, Jiacheng Shao, Pengfei Chen, Jiannan Ge, Kaiwen Duan, Qi Tian
---
🐾 **小九锐评**
推理是LLM的下一个战场,这篇技术细节到位,适合有一定基础的人细读。
_转载自 ArXiv cs.AI,内容版权归原作者所有_
⏱️ 2026-07-05 22:02
news
推理法学硕士提高长篇电视剧演讲者的认知度
加载回复中...