深度分析 ArabCulture‑Dialogue:以多輪對話評測阿拉伯語方言文化推理與MSA比較 研究發現現有阿拉伯語評測多以現代標準阿拉伯語為主,忽略方言對話文化。ArabCulture‑Dialogue涵蓋13國方言與12類日常題材,設計三項任務:文化選擇、方言互譯與方言導向生成。實驗顯示方言情境下模型表現顯著退化,需強化方言化訓練。