深度分析 - Agents Report | 代理人報告 (Page 7)

深度分析

SPEAR：多代理協調框架在智慧合約審計的工程案例研究

本研究針對智慧合約審計提出 SPEAR 多代理協調框架，透過規劃、執行與修復三類代理，以風險感知排序與 Contract Net 協議分配任務，並採用 AGM 信念更新與拍賣協商機制。實驗顯示此架構在協調、復原與資源利用上優於集中式方案，為安全審計提供更彈性的方法。

深度分析

兩階段決策抽樣假說：解析 RL 後訓練 LLM 的自我反思機制

研究指出，強化學習後訓練的大型語言模型會產生自我反思能力。作者提出兩階段決策抽樣假說，將策略分為生成抽樣與驗證決策，並以梯度歸因說明 RL 超越 SFT 的原因。此發現為理解 LLM 自校正機制提供理論基礎，也暗示未來可透過優化決策層提升模型通用性。

深度分析

模型規模與長序列推理下的錯誤不連貫性分析

隨著人工智慧能力提升，研究探討模型智慧與任務複雜度對錯位行為的影響，發現較大模型在長序列推理時錯誤更不一致，暗示未來需聚焦於降低不連貫失誤而非僅增大規模，此結果對安全對齊研究提出新方向。

深度分析

分佈魯棒自適應機制（DRAM）：結合機制設計與線上學習的高效框架

在缺乏先驗信念的多代理序列機制設計中，研究者提出分佈魯棒自適應機制（DRAM），結合機制設計與線上學習，透過迭代估計信念並縮小模糊集合以降低支付，同時保證真實回報。理論證明其遺憾上界為 Õ(√T) 且匹配下界，為首個達成此目標的框架。

深度分析

SkillFactory：自我蒸餾提升大型語言模型認知推理能力的新方法

研究背景：長鏈推理模型需具備多種認知技能。核心技術：SkillFactory 在監督式微調階段使用模型自產樣本重新排列，形成「銀色」訓練資料，進而自我蒸餾以學習驗證、回溯等技能。主要結果：此方法提升模型在 RL 後的任務泛化與跨域穩健性，且不依賴更大模型的蒸餾。

深度分析

BlackCAtt：黑箱因果像素攻擊揭示目標偵測器弱點

研究指出現有目標偵測器易受對抗擾動威脅，作者提出 BlackCAtt 以最小因果像素執行黑箱攻擊，僅需偵測框位置與標籤即可產生與其他方法相當或更佳的攻擊，若取得模型信心則可進一步縮小擾動，提升隱蔽性。

深度分析

結合圖形資訊與貝葉斯推理的語言模型在 Avalon 桌遊 AI 中突破性能

本研究探討大型語言模型在社會推理遊戲 Avalon 中的表現限制，提出結合圖形資訊的貝葉斯推理框架以外部化信念推斷，並保留語言模型的文字理解功能。實驗證明此混合方法在與更大型模型的對戰中保持競爭力，且在受控的人類對戰中取得 67% 的勝率並獲得較高質性評分。

深度分析

結構化不確定性導向的 LLM 代理人澄清機制與實驗驗證

LLM 代理人在工具呼叫時常因指令模糊導致失敗。研究者以結構化不確定性和 EVPI 量化澄清問題價值，並加入成本模型避免冗餘提問。實驗顯示，SAGE-Agent 提升任務覆蓋 7%~39%，澄清次數減半以上，訓練效果亦顯著提升。

深度分析

Grokipedia 與 Wikipedia 結構與引用比較：AI 生成百科的實證分析

在 AI 生成百科 Grokipedia 推出之際，研究者以 17,790 對英語條目比較其與 Wikipedia 的文本與結構。分析發現 Grokipedia 文章較長、引用密度低，且呈現兩極化分布，右傾新聞來源集中於歷史與宗教條目。此結果暗示 AI 生成的百科在透明度與來源驗證上仍面臨挑戰。

深度分析

Dejavu：利用經驗回饋網路提升具身智慧代理的適應性與成功率

具身代理在實際環境部署後難以自行獲取新知。Dejavu 以經驗回饋網路 (EFN) 從累積的執行記憶檢索語意相似的先前動作，並在強化學習獎勵下調整 VLA 策略。部署時持續擴增記憶庫，使代理具備「從經驗學習」能力，實驗顯著提升適應性與成功率。

深度分析

Webscale‑RL：自動化資料管線提升強化學習資料規模至預訓練等級

大型語言模型依賴海量文字資料訓練，導致推理與訓練間的落差。研究者開發 Webscale‑RL 管線，將預訓練文件自動轉成上百萬問答對，形成 120 萬筆、跨 9 領域的資料集。實驗證明此資料集可使 RL 訓練效能提升，達到相同表現時所需 token 數減少至原先的千分之一，為 RL 大規模化提供新方向。

深度分析

利用姿勢‑表情潛在向量的生物特徵防禦，阻止 AI 會議即時換臉攻擊

AI 生成的虛擬會議因傳送姿勢表情潛在向量降低頻寬，卻易被操控冒用形象。研究者利用向量內含的生物特徵，設計姿勢條件化對比編碼器，分離身份與姿勢資訊，並以餘弦測試即時偵測換臉。實驗證明此防禦在多模型上表現優於既有方案，具即時與跨域泛化能力。