PrefBench:隱藏偏好下的個人化定價談判基準
定價談判因買方偏好隱藏而具挑戰性。研究提出PrefBench,一個模擬器基準,將賣方限制為回傳嚴格JSON動作並隱藏買方變數。作者在7,500個回合測試零-shot大型語言模型,模型成交率超過0.99但利潤表現弱於簡單讓步啟發式。表明結構化動作與高成交率不等於利潤最優。
PrefBench 揭示:高成交不等於高利潤
在買方偏好被隱藏的情境下,賣方能談成很多交易但仍可能定價不佳。PrefBench 是一套模擬器基準,專注於個人化定價的隱藏偏好問題。
每個回合配對一名模擬買方與固定商品組合;賣方可見公開人物描述、商品資訊與談判紀錄,買方的估價、耐心、還價與放棄決定由潛在變數控制。測試以固定的狀態摘要和嚴格JSON動作介面限制智能體,強制代理輸出結構化動作。
作者在7,500回合中比較零-shot大型語言模型與啟發式參考策略。結果顯示,模型普遍遵守協議且成交率超過0.99,但賣方利潤表現薄弱:最佳模型的平均利潤僅略高於隨機基準,卻遠不及一個簡單的讓步啟發式策略。
研究指出,結構化動作合規與高成交意願,並不保證利潤敏感的談判表現;PrefBench 提供可控且可重現的評估環境,有助於未來針對利潤導向的定價代理進行改良與驗證。
延伸閱讀
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。