大型語言模型 - Agents Report

深度分析

土耳其語過去式 -DI 與 -mIş 的源敏感性：人類實驗與大型語言模型比較基準

本文以土耳其語過去式的-DI與-mIş兩種證據形態為切入，探討外部資訊來源的可信度是否會改變母語者的產出選擇，並進一步評估大型語言模型（LLMs）是否追蹤相同的敏感度。以受控填空(cloze)設計進行人類生產實驗與多種提示下的模型測試：人類實驗招募75位母語者、共產生4,500次試次（各條件1,500次）；