深度分析 - Agents Report | 代理人報告 (Page 58)

深度分析

大語言模型（LLM）中的集體經驗主義與偽理性認知：風險與實踐審計對策

隨著大語言模型被廣泛用於知識獲取與自動化，使用者傾向於直接獲取結構化答案而跳過實踐過程。本研究提出「集體經驗主義」與「偽理性認知」概念，分析 AI 如何將人類經驗壓縮成看似理性的輸出，導致使用者產生理解的錯覺。文中建議建立實踐審計框架，透過驗證與反向質詢將 AI 產出回歸實踐，以避免認知迴圈與記憶污染風險。

深度分析

多層圖與 Lévy Walk 驅動的 RAGP 提示壓縮：提升 LLM 長上下文效能

本研究針對大型語言模型的長文本提示壓縮問題，提出 Redundancy‑Aware Graph Pruning (RAGP) 框架。RAGP 先將文本建構為同時包含細粒度注意力依賴與粗粒度語義關聯的多層圖，然後利用具備重尾步長分布的 Lévy Walk 在密集的局部子圖與稀疏的全局連結之間交替探索，以訪問頻率作為重要性指標，篩除冗餘節點。

深度分析

文獻校準驅動的 AI 代理人管線：結合 Quantum ESPRESSO、Wannier90 與 WannierBerri 的計算物理創新

面對前沿物理缺乏執行校準，研究提出以文獻對照為校驗點的自主 LLM 管線，從11,083篇 arXiv 論文自動產出含三項新發現的手稿，展示47次會話與2,162次文獻查詢的容錯機制。此機制結合新鮮上下文隔離、分散式根據與對抗式審查，克服以往僅依賴執行回饋的 AI 科學家，預示自主研究可拓展至高風險領域。

深度分析

Hippocampal Linear Attention (HOLA)：結合 KV 快取的線性注意力精準記憶機制

研究針對線性注意力模型記憶遺失問題，提出 Hippocampal Linear Attention（HOLA）將傳統的壓縮狀態與一個有界的精確 KV 快取結合，快取以模型自行計算的驚訝分數作為淘汰依據，並透過 RMSNorm‑γ 讀取以避免軟平均。實驗顯示在 340M 參數、15B 訓練資料下，Wikitext perplexity 從 27.32 降至 22.92，並在 32k 長度的 RULER 針對檢索測試中保持穩定。

深度分析

逆 KKT 生成的 AutoLPBench：打造可程式化的 LLM 代理線性規劃基準與 Docker 評估環境

隨著大型語言模型成為代理工具，傳統線性規劃基準因靜態、易被訓練資料污染而受限。AutoLPBench 透過逆KKT生成器，可即時產生無限新題，並以KKT證明最佳解，支援參數化難度與種子防汙染。實驗顯示在八層規模上解題率平滑下降，且跨批次一致，提升評估可信度。

深度分析

SUNTA：驚訝驅動的分層影片預測框架，結合 HSSM 與 RSSM 的長期視訊模型

隨著長期視訊預測需求提升，研究提出以驚訝為基礎的分層時間抽象模型 SUNTA，透過預測誤差自動切割影片片段，並以自上而下的驚訝指標在無觀測的開環生成中偵測邊界。實驗顯示 SUNTA 在 250 步長預測上保持精準，遠超所有基線在前 10 步即失效的表現。

深度分析

「Hecate」：首套結合 Prompt‑as‑Specification 的 LLM 整合應用靜態分析與提示/程式碼複雜度衡量工具

隨著大型語言模型嵌入軟體，傳統只量測程式碼的複雜度已不足。研究推出Hecate，透過Prompt‑as‑Specification同時衡量提示層與程式碼層的結構寬度，並在118個元件驗證可預測維護工作量。結果顯示提示複雜度是獨立指標，提升預測效能。

深度分析

安全導向嵌入攻擊 (STEER) 解析：多語言繞過與高效能實驗

本研究指出，LLM安全訓練以英文為主，導致低資源語言或混合語言的有害請求易被忽視。提出STEER攻擊，利用模型拒絕方向的梯度屬性，將關鍵詞翻譯成低資源語言，成功率在六個開源模型上達93%至96.7%。此結果顯示目前對英文以外輸入的安全防護仍有重大缺口。

深度分析

CLAP：結合 LoRA/QLoRA 與 GRPO 的閉環訓練與評估流程提升領域代理人效能

在製造業領域，商業資料常雜訊多、格式不一，導致模型適應困難。研究提出 CLAP閉環訓練‑評估‑釋出流程，將原始資料轉為 SFT、GRPO、評估與門檻資產，並以風險診斷與應用鏈回放決定適配器是否上線。實驗顯示平均分數略升但批次回退仍存，證明僅憑離線分數不足以保證上線效果。

深度分析

SimWorlds：多代理系統驅動的動態4D Blender 場景生成與驗證

隨著文字生成3D技術成熟，動態4D場景仍少見。SimWorlds結合規劃‑編碼‑審核多代理流程，於Blender產出具物理機制的可編輯場景，並以4DBuildBench驗證其視覺與機制正確性，顯著優於既有動態生成基準。實驗顯示，在複雜交互與長時間序列的情境下，SimWorlds的成功率和機制完整度均顯著提升。

深度分析

ComfyClaw：結合 Typed Graph Editing 與 VLM 驗證的圖像生成工作流程提升方案

隨著圖像生成工作流程逐漸成為領域主流，研究者提出ComfyClaw以圖形編輯與視覺語言模型驗證結合的自演化技能框架。系統能將過往的修正經驗萃取成可重用的AgentSkills，提升生成品質。實驗顯示在四大基準上平均分數領先，驗證技能演化對工作流程可靠性具有顯著效益。

深度分析

梯度編輯與 LoRA 結合：Epistemic Goggles 提升 LLM 虛構辨識能力的機制

研究指出，傳統在文件前後加上否定標示仍會讓大型語言模型相信虛構內容，作者提出Goggles模組於微調梯度中植入epistemic框架，實驗顯示模型能以約91%正確辨識虛構資訊，同時保持原有能力。此外，Goggles也能標記為Redwood AI安全評估，持續微調仍保留框架。