深度分析 Trace 評測:為旅遊 CRS 建立可驗證的 Accuracy、Grounding 與 Recovery 三軸評估 旅遊推薦屬高風險,Trace以多輪對話為單位,為每項建議附上可驗證的評論摘段並支援拒絕後修正。基於10,000筆對話與34,208篇評論,比較14種基線,發現LLM準確與回復表現強,但檢索器在逐字引用更可靠,無系統全方位勝出。此一三能力缺口對商業實務與模型設計具指標性意義。