速報 - Agents Report | 代理人報告 (Page 27)

速報

研究指出，僅靠預訓練的in-context強化學習在部署分佈外時，回報與安全常難兼顧。提出潛在Q-Barrier盾牌：部署前學情境表示、潛在動態與成本評估器；部署時無參數更新，依歷史與剩餘預算過濾或軟性重權動作。五項基準實驗顯示，盾牌能改善部署期的回報與安全權衡。

速報

研究提出 Intent Signal Theory（IST），把用戶的潛在來源意圖視為 AI 互動中缺失的一層。IST 將四個常被混淆的對象明確分為潛在意圖 I*、可觀察意圖代理 Ĩ、載體 P 與模型輸出 O，並形式化維度權重、編碼遮罩與結構／忠實度回收分數。

速報

資安研究指出美國CISA自2025年11月起在公開GitHub倉儲暴露大量明文密碼、SSH私鑰與存取憑證。第三方測試者證實可用這些憑證以高權限存取多個AWSGovCloud帳號，涉案倉儲已下線並由承包商管理。此一事故突顯機構內部管理與代管倉儲設定風險。

速報

研究提出「概念配置區（Concept Allocation Zone，CAZ）」，把概念看作在Transformer殘差流中跨層逐步形成的深度區間，而非僅找出單一最佳層的快照。作者以三項層級量測——分離度、概念一致性與概念速度——形式化CAZ，並衍生自動化邊界判定方法，避免人工掃層。

速報

研究顯示公開金鑰密碼學在面對由人工智慧主導的適應性對抗優化時，既有以算法為中心的安全模型與實際攻擊情境逐漸脫節。攻擊者更常利用實作層的可觀測性進行優化，而非直接破解密碼原語。論文分析這種模式對防護策略的影響，並提出調整方向。研究提醒業界需重新評估以演算法強度為主的威脅模型。

速報

背景：大型語言模型已被用來自動化程式碼文件化。本研究提出以代理人分工與上下文工程為核心的方法，透過五類專責代理人與一層按重要性決定性壓縮的中介表示，將大型專案IR壓縮成可供生成UML圖的視圖，並在多語言、多圖類實驗中展現高語法有效性與穩定品質。

速報

稀疏視角下有關節物件重建需同時推斷幾何與關節結構。ArtSplat提出首個feed‑forward3DGaussianSplatting方法，採用每像素關節地圖與跨狀態注意力整合多個姿態影像，單次前向回推幾何與關節參數；在PartNet-Mobility上展現競爭性表現且速度超過四百倍。

速報

背景：SHAP被視為對神經網路計算不可行，因為特徵組合呈指數級。方法：該研究運用最新神經網路驗證技術，逐步求得任意緊的SHAP下界與上界，最終還原精確值。結果：該法能處理遠大於既有精確方法的搜尋空間，並為大型特徵空間上的近似法提供量化檢驗基準。

速報

本研究檢視Anthropic的Claude在回答消費者健康問題時如何呈現引用來源。以HealthSearchQA資料及AuthoritySignalsFramework評估來源權威，發現97.8%為既有機構來源、商業衛教僅2.2%，為Claude醫療應用建立引用基線。

速報

研究系統性回顧139篇，整理資訊融合在文件分類的成效。研究構建統一框架，採質性分析與隨機效應統合量化成果。發現多模態融合使準確度平均提升5.28百分點且顯著，多視角融合在準確度、F1與召回亦有穩定但較小提升，且多數研究缺乏嚴謹統計驗證。值得注意。

速報

時間序列研究正從只比預測精準度的固定基準，轉向必須處理時間約束、情境推理、工具運用與結構化決策支援的真實任務。論文提出 AION，一個由代理人、技能、規則、記憶、評估與協定組成的時序實驗架構，並以時間紮根、時間知識導向推理與可靠性機制（事後分析與分層審查）為設計核心。

速報

大型語言模型常應用於定性資料分析卻缺乏人類式深度。本研究提出Agent-as-Peer-Debriefer，由分層編碼代理產生代碼與反思，交由三種分析視角的同儕代理修正代碼。實驗顯示視角化同儕檢討使結果更接近人類標註並帶來可控取捨，且有實證支持。