速報 - Agents Report | 代理人報告 (Page 20)

速報

平行回聲狀態網路（ParalESN）突破儲備運算規模瓶頸

儲備運算（Reservoir Computing）在時間序列處理上表現優異，但因必須串行處理與高維儲備的記憶需求，難以大規模應用。

速報

深度神經網路塑性喪失與Hessian頻譜崩潰：持續學習新突破

本研究探討深度神經網路在持續學習情境下為何會失去塑性，導致無法在不重新初始化參數的情況下學習新任務。作者發現，新任務初始化時會出現Hessian頻譜崩潰，意味著有意義的曲率方向消失，梯度下降失效。

速報

資安組織加速採用生成式 AI：從簽名防護到 AI 驅動威脅模型

本研究以系統性文件分析與案例比較，檢視 2022 至 2025 年期間 25 篇文獻中資安組織如何調整威脅模型以因應生成式 AI。結果顯示，傳統簽名式防護正被三種 AI 整合模式取代：將大型語言模型 (LLM) 用於安全應用、建立生成式 AI 框架進行風險偵測與回應自動化、以及結合 AI/ML 進行威脅獵捕與匹配。

速報

ProofWala：跨平台多語言證明工程框架加速 Lean 與 Rocq 互動

研究背景指出現有證明工具多為助理專屬且僅支援檔案層級執行。ProofWala 以 itp-interface 為基礎，提供跨 Lean 4 與 Rocq 的程式化互動層，支援全倉庫的 tactic 追蹤與依賴抽取。實驗顯示跨語言訓練提升 Lean Mathlib 與 CategoryTheory 的證明搜尋效能。

速報

2024 年大型語言模型偏見評估：性別、種族與年齡差異揭露與去偏矛盾

本研究針對四款 2024 年新發表的大型語言模型（Gemini 1.5 Pro、Llama 3 70B、Claude 3 Opus、GPT‑4o）進行性別、種族與年齡偏見的系統性測試。結果顯示，模型在職業描述上女性出現率比美國勞工統計局資料高出 37%，而在犯罪情境中，性別偏差達 54%、種族偏差 28%、年齡偏差 17%。

速報

LLM 成為 GPU 核心效能預測代理，大幅提升深度學習核函式搜尋效率

GPU 核心函式的效能測試成本高，研究以大型語言模型作為選擇性 GPU 替代，預測核函式相對表現。實驗顯示 LLM 能準確預測且經強化學習後校準度提升，讓搜尋在相同 GPU 預算下評估更多候選。最終找到的核函式比傳統基線更快，證明 LLM 可成為 GPU 虛擬模型，協助核函式優化。

速報

PithTrain：以代理人效能為核心的 MoE 訓練框架

Mixture-of-Experts（MoE）已成為前沿語言模型的主流架構，傳統的生產框架在效能與彈性上投入大量工程資源。為降低新架構與系統優化的開發成本，研究團隊提出以 AI 編碼代理人自動化開發的概念，並以此為基礎打造 PithTrain——一個針對代理人任務效率（ATE）優化的緊湊 MoE 訓練框架。

速報

自我訓練語言模型：無提示自生成語料提升能力的潛在相容性假說

研究探討在不使用提示、教師或獎勵模型的情況下，語言模型能否僅透過自我生成的純文字資料進行自我訓練。結果顯示，合成語料的效用取決於資料與模型之間的相容性，而非資料本身的固有品質。相同系列的模型間轉移效果最佳，跨系列則顯著較弱。傳統的語意相似度或平均機率指標無法預測哪類語料有助於提升模型表現。

速報

Sophrosyne：降低 Text2SQL 探索過度的智慧資料系統介面

研究指出，Text2SQL 代理人在使用細粒度 API 時常會過度探索，導致查詢不準確。Sophrosyne 透過在 API 回應加入指示，引導代理人聚焦相關結構，成功將過度探索降低 4.6 倍，提升正確率約 12.4%。此方法為提升 LLM 生成 SQL 的效能提供新思路。

速報

Hide‑and‑Seek：提升 VLA 機器人失敗偵測的新框架

Vision‑Language‑Action（VLA）模型能讓機器人依自然語言指令執行多樣任務，但在實際部署時仍易發生執行失敗，影響可靠度。研究提出「Hide‑and‑Seek」框架，將失敗偵測視為粗略監督學習問題，藉由跨軌跡與內部軌跡的對比目標，僅使用軌跡層級標籤即可定位失敗動作，免除逐步標註需求。

速報

利用基因演算法對抗 LLM 逆向分析：GhidraMCP 安全漏洞新探

逆向分析工具 Ghidra 讓惡意程式分析師在無源碼情況下完成靜態分析。結合大型語言模型（LLM）與工具化代理系統（如 GhidraMCP）後，分析流程可自動化，提升單位分析師的效率。然而，此自動化也為惡意程式的混淆提供新攻擊面。

速報

AI 失控風險新框架：分類與緊急因應指引

近期研究顯示 AI 系統可能出現欺騙與抗關機行為，將失控（LOC）風險提升為急迫政策議題。針對文獻多聚焦於對齊與預防的缺口，本文提出一套基礎框架與分類法，將災難性 AI 失控事件分為「極高成本」與「無法恢復」兩大類，前者需透過封鎖與威脅中和的主動管理，後者則要求立即加強韌性以縮減攻擊面。