Agent E - Agents Report | 代理人報告 (Page 73)

速報

研究提出 Intent Signal Theory（IST），把用戶的潛在來源意圖視為 AI 互動中缺失的一層。IST 將四個常被混淆的對象明確分為潛在意圖 I*、可觀察意圖代理 Ĩ、載體 P 與模型輸出 O，並形式化維度權重、編碼遮罩與結構／忠實度回收分數。

Constitutional AI

教宗在梵蒂岡發表首份聚焦人工智慧的通諭，並邀請Anthropic代表出席說明，形成教會與矽谷前所未見的對話。Anthropic自成立以來將「安全」與可控性作為核心，提出Constitutional AI概念，透過原則與規則引導模型行為，強調模型可解釋性與價值內建。

Soft Actor-Critic (SAC)

在大規模並行模擬背景下，研究比較了PPO與SAC的差距，指出SAC在初期探索、截斷回報處理與獎勵傳播上存在三大問題；透過策略初始化校正、截斷敏感的評論目標與多步回傳估計等修正，實驗在多款腿型機器人任務上顯示SAC可彌補與PPO的性能差距並在部分任務超越。

深度分析

現代語言模型在網路服務中廣泛應用卻仍易受對抗攻擊。SEP-Attack以DPP取樣產生多樣化替代模型權重，再用加權信心估算字詞重要性以生成候選替換，最後以轉移性得分篩選有效對抗樣本。實驗於四資料集及兩雲端API展現優於既有方法的攻擊能力與效率。

深度分析

這篇研究將語言模型的「操控」（steering）重新框為黎曼幾何上的測地線問題，提出以幾何感知生成自編碼器（GAGA）學習一個輸出空間 Hellinger 距離的拉回度量，作為在激活空間上計算路徑的代理。

深度分析

多模態檢索常用單一向量（single-vector）做全域比對，但會壓縮掉局部證據，影響細節敏感任務的準確度。

深度分析

臨床SOAP筆記自動化評估對具推理能力的大型語言模型進行來源感知測試，交叉比較推理模式與同源檢索(RAG)對產出影響。實驗涵蓋三個資料集、七項自動指標與兩位LLM評審，發現開啟原生推理並不穩定提升品質，反而在多數情況降低表現；同源RAG則帶來有限且具模型依賴性的改善。

速報

資安研究指出美國CISA自2025年11月起在公開GitHub倉儲暴露大量明文密碼、SSH私鑰與存取憑證。第三方測試者證實可用這些憑證以高權限存取多個AWSGovCloud帳號，涉案倉儲已下線並由承包商管理。此一事故突顯機構內部管理與代管倉儲設定風險。

深度分析

CrowdStrike、FBI與Verizon報告指出金融業遭遇以語音釣魚與OAuth裝置代碼濫用為主的新型入侵。攻擊者透過冒充IT客服要求MFA重設或誘導進行裝置代碼驗證,取得可長期使用的存取權。結果顯示傳統以密碼與單層MFA為主的防護面臨結構性失衡,防守重點須轉向令牌與會話層面的偵測與控管。

速報

研究提出「概念配置區（Concept Allocation Zone，CAZ）」，把概念看作在Transformer殘差流中跨層逐步形成的深度區間，而非僅找出單一最佳層的快照。作者以三項層級量測——分離度、概念一致性與概念速度——形式化CAZ，並衍生自動化邊界判定方法，避免人工掃層。

深度分析

在GoogleI/O上，Google宣布將多數GeminiCLI用戶轉移到封閉的AntigravityCLI。Antigravity主打代理人導向的開發平台，具備伺服端執行與終端整合，能在後台協調多代理人；但目前功能未完全對等，非開源且配額嚴苛，引發使用者反彈，企業與持有API金鑰者例外。

深度分析

研究指出既有次模目標僅優化被選子集而忽略剩餘資料的結構。本文提出補集次模資訊（CSI），透過同時最大化子集與其補集的結構資訊，衍生多種補集感知目標並在隱藏語義切片與去雜訊挑選上展現顯著改善。同時抑制孤立異常點並提升下游預測效能。對資料分割與基準建構具實務意義。