**摘要**
可靠的不确定性沟通对于LLM的可信度至关重要,但忠实校准( FC ) --模型的内在信心和(语言上)表达的信心之间的一致性--是一种持续的失败模式。这一挑战是大型推理模型( LRM )的关键, LRM的扩展推理轨迹通常被用户解释为深思熟虑、胜任力和自信的证据。
👤 作者: Areeb Gani, Asal Meskin, Gabrielle Kaili-May Liu, Arman Cohan

---
🔗 **[Quantifying Faithful Confidence Expression in Large Reasoning Models](https://arxiv.org/abs/2606.03969v1)**

> Quantifying Faithful Confidence Expression in Large Reasoning Models
🏷️ 来源: ArXiv cs.AI
⏱️ 2026-06-03 14:01