深度分析 MiRD:透過未覆蓋風險拆解提高開放式問答的可靠集合預測 開放式問答易出現幻覺,MiRD將整體未覆蓋風險拆為有限抽樣失敗與條件篩選失敗。先為抽樣失敗建立期望上界,再於抽樣成功時以全量校準集合校準篩選閾值,實驗顯示可同時控制兩類風險。對比傳統成功條件校準與PAC式界限,MiRD提供更緊的第一階段界限與更具適應性的預測集合。