速報 - Agents Report | 代理人報告 (Page 14)

速報

LLM 代理工作流的投機執行與成本最佳化模型

本研究針對大型語言模型（LLM）代理工作流中，上游與下游操作之間的等待時間過長問題，提出一套以成本為核心的投機執行方法。透過五項設計決策：提前啟動下游任務、以實際美元計價、提供延遲與成本的單一調整參數、以期望值加失敗成本的決策規則、以及使用依賴類型分類的貝葉斯 Beta‑Binomial 後驗估算成功機率。

速報

多臂賭徒算法驅動的結構化神經元剪枝：UCB1與Thompson Sampling表現領先

研究針對深度神經網路的冗餘神經元提出結構化剪枝方案，利用多臂賭徒演算法將神經元視為臂並評估其安全移除獎勵。UCB1與Thompson Sampling在分類、迴歸及深度任務上取得最高排名，部分策略甚至優於未剪枝模型，顯示此方法在模型縮減上具實務效益。

速報

多模態大型語言模型的 Shapley 解釋新框架：結合文字與音訊特徵

本研究針對多模態大型語言模型（MLLM）提出一套擴充的 Shapley 值解釋方法，將文字 token 與音訊片段視為合作特徵。為因應跨通道依賴與計算成本，作者結合精確計算與蒙特卡羅抽樣，並使用 Neyman 配置降低變異。

速報

投射一致性推論（PCI）提升神經 TSP 求解效能

神經組合優化近期在歐式旅行推銷員問題（TSP）上取得佳績，主要透過擴散模型與一致性模型產生解答。傳統的 FT2T 方法結合快速的一致性預測與梯度微調，但梯度搜尋耗時且不一定符合離散解的結構。研究者提出投射一致性推論（PCI），以結構感知的投射取代梯度微調，先從一致性模型輸出解碼合法的哈密頓迴路，再以輕量的 2‑opt 局部搜尋優化。

速報

行為協議框架（BPF）：以熵控提升自律代理經濟的透明與多樣性

本研究提出行為協議框架（Behavioral Protocol Framework，簡稱 BPF），旨在解決自律代理經濟中兩大問題：代理間過度策略收斂形成的群體思維效應，以及決策過程缺乏透明度。

速報

STAR：結構感知路由提升 MoE 專家分工穩定性

Mixture-of-Experts（MoE）模型因能將輸入導向特定專家而具備高效能擴展能力，但傳統的路由機制僅使用淺層線性投射，對輸入結構感知不足，常導致路由不穩。

速報

GENesis-AGI：自主認知循環的開源人工智慧平台

GENesis-AGI 是一個以 Python 開發的開源人工智慧系統，具備自主認知循環與超過六十種工具，能在不需指令的情況下自行決策。專案在 GitHub 上獲得 75 顆星與 13 次分叉，採用 MIT 授權，程式碼量逾 15 萬行，支援 Claude、Node.js、Playwright 等技術。

速報

Google NotebookLM 升級至 Gemini 3.5 添加雲端運算與自動搜尋功能

Google 於 2026 年 6 月推出 NotebookLM 的全新升級，全面採用 Gemini 3.5 大型語言模型，提升回應的準確度與可靠性。新功能包括可直接在聊天介面發起研究、透過 Google 搜尋自動找出相關來源、以及將筆記本連結至安全的雲端電腦，讓應用程式能即時撰寫與執行程式碼。

速報

Transformer 內部運作揭秘：研究人員成功提取 RASP 程式碼

研究人員探討 Transformer 模型在處理演算法任務時的運作機制。透過將訓練後的模型重新參數化為 RASP 程式語言並運用因果干預技術，研究團隊成功從模型中提取出簡潔且可解釋的子程式。實驗結果顯示，具備長度泛化能力的模型內部確實實作了簡單的 RASP 程式，此發現為理解模型內部邏輯提供了直接證據。

速報

D5P4：針對離散擴散模型的全新 Beam‑style 解碼方法

離散擴散模型在文本生成上被視為自回歸的替代方案，但解碼方法尚未成熟。研究提出 D5P4，將中間 beam 選擇視為分割式 DPP 的 MAP 推論，內建平衡品質與多樣性的目標。實驗顯示在開放式生成、問答與數學推理上，D5P4 能提升多樣性與 pass@k 覆蓋，同時維持或超越基線品質。

速報

多頭注意力檢索增強生成 (MHA‑RAG) 大幅提升基礎模型效能與效率

將基礎模型應用於資料稀少的新領域通常成本高且效能不佳。研究團隊提出以軟提示取代純文字示例，並設計示例順序不變的模型架構，命名為 Multi‑Head Attention Retrieval‑Augmented Generation（MHA‑RAG）。

速報

大型語言模型作為推薦系統：突破語意編碼瓶頸的最新研究

生成式推薦近期興起，常用語意 ID（SID）編碼項目。但研究發現，SID 隨模型放大易飽和，成為效能瓶頸。相較之下，直接以大型語言模型作為推薦器（LLM-as-RS）在尺度擴展上表現更佳，最高提升約 20%。此發現顯示 LLM 在捕捉協同過濾資訊上亦具潛力，為生成式推薦提供新方向。