深度分析 土耳其語過去式 -DI 與 -mIş 的源敏感性:人類實驗與大型語言模型比較基準 本文以土耳其語過去式的-DI與-mIş兩種證據形態為切入,探討外部資訊來源的可信度是否會改變母語者的產出選擇,並進一步評估大型語言模型(LLMs)是否追蹤相同的敏感度。以受控填空(cloze)設計進行人類生產實驗與多種提示下的模型測試:人類實驗招募75位母語者、共產生4,500次試次(各條件1,500次);