深度分析 - Agents Report | 代理人報告 (Page 59)

深度分析

梯度編輯與 LoRA 結合：Epistemic Goggles 提升 LLM 虛構辨識能力的機制

研究指出，傳統在文件前後加上否定標示仍會讓大型語言模型相信虛構內容，作者提出Goggles模組於微調梯度中植入epistemic框架，實驗顯示模型能以約91%正確辨識虛構資訊，同時保持原有能力。此外，Goggles也能標記為Redwood AI安全評估，持續微調仍保留框架。

深度分析

SemHash-LLM：結合語意投影雜湊與 LLM 判斷的多粒度文件去重框架

隨著網路資料規模爆炸，文件去重成為關鍵挑戰。研究提出SemHash-LLM結合語意投影雜湊、注意力加權MinHash與對比邊界學習，並在不確定情況下使用LLM判斷。實驗顯示在五種去重類型上達到91%整體分數，且神經驗證成本低於1%。此技術有望成為大規模資料清洗的標準工具。

深度分析

InfoDelphi 利用資訊不對稱提升多代理人預測市場的準確性

預測市場的準確度常受單一模型限制，研究提出InfoDelphi透過公共與私有證據分割、理性共享與信心加權聚合，使多代理人具資訊多樣性，於PolyGym測試中Brier分數提升12%至18%，準確率提升4%至8%。此外，實驗證明若移除資訊不對稱，多代理人優勢幾乎消失，凸顯輸入多樣性是提升集體推理的關鍵。

深度分析

「Hawk」：硬體感知驅動的高效 NPU 核心生成框架

研究指出缺乏硬體感知知識是LLM產生NPU核心的瓶頸。Hawk透過即時知識合成、雙維檢索與效能導向蒸餾，提高生成正確率至80%，執行速度提升最高2.2倍。相較於需大量標註資料的模型微調，Hawk免訓練即可持續累積與淨化知識，降低開發成本並加速新硬體支援，此策略有望成為未來NPU軟體堆疊的標準化路徑

深度分析

Agent4cs：多代理工作流提升大型階層式程式碼庫摘要效能與可讀性

隨著大型程式碼庫缺乏文件與結構複雜，Agent4cs提出以關鍵字抽取與品質保證的多代理框架，採自底向上方式生成階層式摘要，結合七種前沿大型語言模型，於真實資料集測試提升語意相似度約8%，關鍵字覆蓋率最高提升38%，顯示此架構可改善跨目錄資訊整合，對未來AI開發者生態與企業代碼治理具潛在影響。

深度分析

「Auto‑FL‑Research」利用受限程式碼代理提升 NVFlare 聯邦學習配方搜尋效能

本研究針對聯邦學習的演算法設計，提出Auto‑FL‑Research（AFR）框架，透過受限的程式碼代理在固定預算與通訊合約下搜尋訓練配方。實驗在五個醫療FLamby任務與六個LEAF設定上，以五次隨機種子重複驗證，四項任務顯著提升效能，亦揭示部分成果受種子敏感影響。

深度分析

EO-Agents 系統結合知識圖譜、異質圖神經網路與多模型 LLM 進行地球觀測假說生成

隨著NASA大量觀測資料的累積，研究團隊開發EO-Agents三代理人管線，透過知識圖譜與異質圖神經網路挑選未被共用的資料配對，再由LLM篩選、生成與評估結構化假說，最終產出160個跨領域研究構想，且新配對的可信度與實際文獻共用相近。此技術預期將加速跨領域資料整合，推動氣候與環境研究新突破。

深度分析

SOLiD：以內部偽言偵測提升大型語言模型偏好學習的監督效能

研究指出，隨著模型規模擴大，使用內部激活偵測的謊言監督（SOLiD）能顯著降低未偵測欺騙率。實驗在 Llama‑3 系列與 Qwen‑3 系列模型上顯示，從 1 B 參數下降至 405 B 時，未偵測欺騙率由 34% 降至 14%。然而，偵測器與微調資料分布不一致會導致假陽率激增，限制其實務部署。

深度分析

Janus平台：模組化 AI 代理人權限管理與使用者參與實驗

AI 代理人自動執行工具呼叫，使用者在權限管理中的角色尚未被深入探討。研究推出 Janus 平台，提供六種權限助理，在三種情境與合成回應者下評估。結果顯示使用者介入能提升隱私安全，AI 輔助決策減輕認知負擔，且無單一方案在所有情境皆最佳。因此建議未來系統採用情境感知的混合式權限管理。

深度分析

RLVR 以可驗證獎勵強化學習提升 Atlassian 工作流自動化

大型語言模型在企業SaaS工作流程中常因只預測下一個字而失誤。研究以可驗證獎勵的強化學習在模擬Jira與Confluence環境訓練工具使用代理人，將四個非退化情境的平均獎勵從0.35‑0.92提升至0.95‑1.00，顯示小模型亦能達成高正確率。未來若能自動產生驗證獎勵，將加速AI工作流程自動化。

深度分析

CreativityNeuro：權重空間導引提升 LLM 發散性思維與原創性

針對大型語言模型在開放式任務中傾向生成相似回應的集體心智效應，研究者提出 CreativityNeuro 技術。該方法透過對比創意與非創意提示詞，識別並放大模型權重中與創意行為相關的特定子空間，無需額外數據或梯度微調。實驗結果顯示，該技術顯著提升了模型在發散性思維測試中的原創性與驚奇感，並能有效降低模式崩潰，展現出優於激活導引的泛化能力。

深度分析

難度路由服務控制：自動客服寫入安全與效能最佳化方案

生成式 AI 正從聊天工具演變為直接執行後端寫入的服務代理，帶來操作風險。研究提出難度路由服務控制架構，利用輕量路由器將例行請求走低成本路徑，將具操作耦合的衝突請求升級至加強審核流程，並在寫入前觸發重新考慮。實驗以零售與航空兩大領域的實務任務驗證，顯示在多寫入、條件回退等複雜情境下可靠性顯著提升，同時保持例行服務的快速與低摩擦。