深度分析
以 LLM 註記 RAB‑Cred:評估丹麥難民裁決中可信度判讀的可行性
本研究以丹麥庇護裁決文本建立RAB‑Cred資料集,測試以開放權重的大型語言模型(LLM)做零樣本與少樣本註記。研究比對多款模型與多種提示,並分析錯誤類型與一致性。結果指出LLM具成本優勢但標註不穩定,建議採用模型或提示混合集成與人類覆核。可供後續研究採用。
深度分析
本研究以丹麥庇護裁決文本建立RAB‑Cred資料集,測試以開放權重的大型語言模型(LLM)做零樣本與少樣本註記。研究比對多款模型與多種提示,並分析錯誤類型與一致性。結果指出LLM具成本優勢但標註不穩定,建議採用模型或提示混合集成與人類覆核。可供後續研究採用。
深度分析
本研究針對程式教育中的學生行為模擬,提出將真實的程式提交與測試回饋序列化為對話式資料,以訓練開放權重的程式學習者模型。方法結合監督式微調與偏好最佳化,使 4B/8B Qwen 模型在模擬除錯行為上優於僅程式碼或大型封閉模型的基線,提升功能對齊與程式碼相似度。