深度分析 精選子集與回歸加權:HUMANS 為大型語音模型建立以人為本的評估基準 面對大型語音模型評估成本高昂,研究提出以精選小型子集搭配回歸加權,快速預測用戶偏好與模型排名。作者示範僅用五十條樣本即可保留與完整基準高度相關,並以776則人工偏好資料訓練回歸模型,達到顯著提升的人類一致度,提供實務可用的高效替代方案。有助縮短評估時程與成本負擔。