大型語言模型 (LLM) - Agents Report

大型語言模型 (LLM)

本研究提出一套以大型語言模型（LLM）為評審的多維行為評估框架，專門檢視代理式股票預測系統在序列決策層面的過程品質。研究將每日決策紀錄切成五日一集，沿六個領域（政期偵測、路由、適應性、風險校準、策略一致性、錯誤回復）逐項評分，並以擾動實驗驗證分數對單一維度的專一性。