大型語言模型 (LLM) 以大型語言模型進行多維行為評估並透過SAC閉環強化學習優化代理式股票預測 本研究提出一套以大型語言模型(LLM)為評審的多維行為評估框架,專門檢視代理式股票預測系統在序列決策層面的過程品質。研究將每日決策紀錄切成五日一集,沿六個領域(政期偵測、路由、適應性、風險校準、策略一致性、錯誤回復)逐項評分,並以擾動實驗驗證分數對單一維度的專一性。