大型語言模型 - Agents Report | 代理人報告 (Page 5)

An infographic comparing how traditional PPO-Clip causes exploration collapse (left) versus how RIPO uses equal-distant clipping on Riemannian manifolds to balance exploration (right).

深度分析

RIPO：在黎曼流形上等距剪裁提升大型語言模型強化學習探索

大型語言模型的強化學習常用PPO‑Clip，但因使用歐式度量與策略流形的黎曼幾何不匹配，導致探索崩潰。研究提出Riemannian等距策略優化(RIPO)，在流形上等距調整剪裁界限，使低機率動作獲得較大更新，平衡探索與利用。實驗顯示在七項競賽基準上，RIPO相較於GRPO提升最高達60%。

An infographic presenting the GAE framework, which integrates GNN program structure perception, an RL meta-controller, and online GRPO fine-tuning to enhance symbolic regression in LLMs.

深度分析

GAE：結合圖形神經網路與強化學習的 LLM 演化搜尋框架提升符號迴歸效能

隨著大型語言模型結合演化搜尋成為科學發現新趨勢，GAE框架透過圖形神經網路、強化學習元控制器與線上GRPO微調，解決父代選擇盲點、獎勵稀疏與靜態突變三大瓶頸，於非線性振盪器符號迴歸測試中取得最佳NMSE，顯示結構感知演化顯著提升搜尋效率與效能。

An infographic showcasing an AI browser prompt injection attack (BioShocking) on the left and its corresponding defense and mitigation recommendations on the right.

深度分析

AI 瀏覽器 LLM 提示注入攻擊示範與防護建議

研究顯示惡意網站可誘導 AI 瀏覽器進入虛構世界，繞過安全防護，讓攻擊者執行代碼抽取或竊取密碼等破壞行為。此手法名為 BioShocking，已在多款 AI 瀏覽器（如 ChatGPT Atlas、Claude 插件）成功示範，凸顯現有防護的根本缺陷。研究者指出，攻擊者利用謎題讓模型接受錯誤答案，進而進入幻想狀態，使原本的 guardrail 失效，並可能導致私密倉庫或內建密碼管理器資料外洩。

An infographic demonstrating the SMETA-ZSL framework, which combines LLMs and cross-modal alignment for zero-shot cybersecurity threat classification.

深度分析

SMETA‑ZSL：結合大型語言模型與跨模態對齊的零樣本資安威脅分類突破

隨著新興惡意程式層出不窮，傳統防禦難以及時取得標記資料。研究提出 SMETA‑ZSL，透過對比微調的語言模型產生語意原型，並以情境式元學習對齊行為特徵，實現開放式零樣本威脅分類。實驗顯示在七項基準上平均顯著提升 10.8 分，最高可達 18.1 分。

深度分析

利用 Program‑Guided 堆疊分頁提升大型語言模型 SOP 執行效能

企業代理人在長期、條件式且安全關鍵的標準作業流程（SOP）上常因文字提示混雜而出錯。研究提出將 SOP 轉譯為可執行的偽代碼，並以程式導向的堆疊機制僅載入當前活躍框架，由大型語言模型負責語意執行。實驗顯示，對兩款高效能模型在七個領域皆提升拒絕正確率至100%，並在銀行測試中整體通過率提升至92.8%。

深度分析

NextFund：統一即時績效追蹤平台，全面可視化 LLM 代理人投資決策

隨著大型語言模型開始參與即時投資決策，傳統評估僅看最終報酬缺乏透明度。NextFund透過即時市場接取、跨市場多代理協作與完整決策紀錄，讓模型表現可比、失誤可診斷。實驗顯示平台提升評估公平性與可操作性。平台支援美國、中國與香港股市，並提供互動式交易競技場，讓使用者從排行榜直觀追蹤每筆交易背後的推理。

Imaging-101 benchmark evaluating LLMs on computational image reconstruction pipelines.

深度分析

全面評估 LLM 在計算影像重建的表現：Imaging-101 基準平台概覽

Imaging-101 以57項經專家驗證的計算影像任務，將流程標準化為前處理、物理建模、逆向求解與視覺化三階段，評估七大前沿LLM在規劃、單元測試與端到端重建三條軌道的表現，結果顯示模型在物理慣例與演算法選擇上仍有缺口，預示未來需專屬領域代理人才能可靠支援計算影像。

深度分析

稀疏自編碼器特徵干預的局部化真相：MCG 評估顯示效率優勢依賴基線匹配

在大型語言模型安全控制的研究中，稀疏自編碼器（SAE）特徵干預被認為能以較少的內部擾動改變行為，然而最新的匹配相干門評估顯示，若不將干預層面與密集基線對齊，所謂的效率優勢往往是比較基線不一致的假象；在同層或投射至SAE解碼器範圍的密集干預下，SAE的優勢甚至會逆轉，且在小模型上常出現單一安全判官的虛假越獄訊號。

深度分析

結合法規層級與大型語言模型的規範驅動細粒度分類方法

在海關關稅、出口管制等需遵循嚴格法規的分類任務中，研究提出具約束感知的階層搜尋框架，將法規文件轉為可搜尋樹狀結構，僅檢索合法子節點並以證據片段指導決策。實驗顯示在四項基準資料上提升整體準確度，並提供可解釋的決策路徑，特別在相鄰細分類別與規則邊界條件的案例中提升幅度最大。

深度分析

UNIT：結合大型語言模型與結構融合的圖形持續學習新框架

在多媒體圖形資料持續湧入的情境下，UNIT透過首次微調LLM並以不確定感知錨點與結構融合模型，克服語意與拓撲分離與知識不平衡問題，實驗顯示其在五大基準上達到最佳表現。該框架僅在首任務微調LLM，後續任務僅更新分類器，顯著降低計算成本，同時在ACC指標上領先2%至5%不等。

深度分析

Who&When Pro：大型多模態 AI 代理失敗歸因基準正式釋出

隨著AI代理能力提升，失敗變得更微妙，研究團隊推出Who&WhenPro基準，透過自動錯誤注入產生12,326筆跨文字、影像、影片的失敗軌跡，證實即使是大型模型仍在定位與診斷錯誤上有顯著挑戰。該基準涵蓋文字、影像、影片三種模態，且支援單代理與多代理情境，實驗顯示開源模型具成本效益，有望促進自我改進代理系統。

Infographic defining AI Agent architecture: Model, Scaffolding, and Harness components.

深度分析

AI 代理核心術語：Harness、Scaffold 與模型完整解析

隨著AI代理快速發展，術語混亂；本文釐清model、scaffold、harness、agent等概念，說明它們在訓練與推論的分工，並指出正確用詞有助於系統設計與跨框架溝通，預期將推動更一致的開發與評估流程。比ClaudeCode、Codex框，說明harnessengineering企業AI代理自動化關鍵。