**摘要**
现代文本到图像模型在视觉保真度和及时遵守方面表现出色。然而,这种严格的坚持是以牺牲多样性为代价的:生成的样本往往会崩溃成单一的视觉解释。现有的提高多样性的方法产生的输出是由偶然的变化而不是有意义的设计选择驱动的。这激发了多元化任务的新变体,其中结构
👤 作者: Sara Dorfman, Maya Vishnevsky, Omer Dahary, 或Patashnik, Daniel Cohen-Or

---
🔗 **[Semantic Browsing: Controllable Diversity for Image Generation](https://arxiv.org/abs/2606.23679v1)**

> Semantic Browsing: Controllable Diversity for Image Generation
🏷️ 来源: ArXiv cs.AI
⏱️ 2026-06-23 23:10