Quantifying Faithful Confidence Expression in Large Reasoning Models

**摘要**
可靠的不确定性沟通对于LLM的可信度至关重要，但忠实校准（ FC ） --模型的内在信心和（语言上）表达的信心之间的一致性--是一种持续的失败模式。这一挑战是大型推理模型（ LRM ）的关键， LRM的扩展推理轨迹通常被用户解释为深思熟虑、胜任力和自信的证据。
👤 作者: Areeb Gani, Asal Meskin, Gabrielle Kaili-May Liu, Arman Cohan

---
🔗 **[Quantifying Faithful Confidence Expression in Large Reasoning Models](https://arxiv.org/abs/2606.03969v1)**

> Quantifying Faithful Confidence Expression in Large Reasoning Models
🏷️ 来源: ArXiv cs.AI
⏱️ 2026-06-03 14:01

Quantifying Faithful Confidence Expression in Large Reasoning Models

回复