深度分析 EmoDistill:以離線蒸餾結合 IQL、LoRA‑SFT 與 JPO 將情緒建為談判技能 在對抗性談判場景,情緒表達會系統性影響代理人的議價結果。EmoDistill以離線LLM對抗談判軌跡為訓練資料,將情緒分為選擇與表達兩部分,採用隱式Q學習選情緒、LoRA微調學表達並以JPO精煉輸出。實驗顯示小型語言模型能在多個談判領域提升用戶端效用並具備部分跨域泛化能力。