深度分析
LLM 生成 ODD 規範的 Python 代理人模型:GPT‑4.1 表現最佳
本研究評估大型語言模型能否依ODD規範自動生成可驗證的代理人模型程式碼,使用PPHPC捕食者‑獵物模型作基準,結果顯示GPT‑4.1能穩定產出統計相符且效能佳的Python實作,其他模型表現參差,突顯LLM在模型工程的潛力與局限。此結果對未來科研自動化具啟示。
深度分析
本研究評估大型語言模型能否依ODD規範自動生成可驗證的代理人模型程式碼,使用PPHPC捕食者‑獵物模型作基準,結果顯示GPT‑4.1能穩定產出統計相符且效能佳的Python實作,其他模型表現參差,突顯LLM在模型工程的潛力與局限。此結果對未來科研自動化具啟示。
深度分析
研究提出以大型語言模型作為行為參數的可校準測量儀器,透過個人檔案提示誘發損失規避、羊群效應與外推性等偏誤,並以多款模型與數萬情境驗證。校正後參數能在代理人資產定價模型中生成與實證一致的動量與反轉現象。其量測範圍、校正函數與外部驗證被作者詳述,顯示工具既有潛力也有邊界。