速報 - Agents Report | 代理人報告 (Page 32)

速報

Claude Managed Agents 將憑證移出代理：自託管沙箱與 MCP 通道守護企業 API

企業連接內部API受制於代理攜帶憑證導致風險。Anthropic推出自託管沙箱與MCP通道，將工具執行移出代理，並以出站單向閘道和私有連線隔離憑證。此架構把憑證控制移到網路邊界，降低被攻破時的暴露面。編排團隊應先以自託管沙箱測試邊界，再評估MCP通道，以調整威脅模型與部署策略。

速報

CISA 明文憑證外洩：公開 GitHub 倉庫曝出密碼、SSH 私鑰與 AWS GovCloud 存取憑證

事件背景：安全研究者發現CISA在公開GitHub倉庫存有敏感憑證。技術重點：倉庫包含明文密碼、SSH私鑰與存取令牌，且紀錄顯示疑似停用GitHub預設的祕密防護。測試結果：可使用該憑證存取多個AWSGovCloud帳號並取得高權限。影響：凸顯政府憑證治理與資安管理風險。

速報

MINE：以可機制性解釋打開影像編碼黑盒，定位驅動體素反應的視覺特徵

研究旨在揭示驅動人類視覺神經反應的影像特徵。MINE以可機制性解釋工具定位自然影像中驅動單一體素的視覺內容，並用與語言對齊的影像表示產出語義描述。實驗以合成影像與反事實編輯驗證因果性，結果顯示方法可捕捉細緻腦區選擇性。研究也能在已知類別選擇性腦區中還原細節差異。

速報

WASIL揭露：阿拉伯語ASR錯誤如何改變LLM助理回應

研究聚焦語音助理中ASR誤辨如何影響使用者意圖與LLM回應。作者釋出WASIL資料集，含阿拉伯語語音、ASR假設、助理回應與喜好標註，並以多ASR一致性指導產出低成本黃金稿。研究再標註可答性類別以區分內在不可答與ASR導致退化，並讓多評審LLM評估無參照回應，發現ASR錯誤會改變回應品質與用戶喜好。

速報

LEAF：以事件增強的大型語言模型預測基準

研究團隊提出 LEAF，一個動態更新的事件增強預測基準，涵蓋未來事件機率、趨勢與時序預測等任務。LEAF 採用遞迴檢索代理系統，並結合雙代理交叉驗證，為預測任務提供相關且即時的輔助文本資訊。作者在多款專有與開放權重的大型語言模型上評估，結果顯示模型能從複雜事件中抽取訊號並提升預測表現；

速報

Google I/O：Gemini 與 Android XR 成為今年焦點

Google在加州Mountain View舉辦年度開發者大會 Google I/O，會中以最新軟體與人工智慧進展為主軸。預期重點包括專為高階裝置設計的 Gemini 智能功能與任務自動化、Android 17 的新功能，以及延伸至車用與筆電的生態。

速報

Rulemapping：神經符號混合提升網路內容審查的法理準確性

自動化法律推理面臨透明度與靈活性的取捨。本研究以Rulemapping方法將大型語言模型納入決定性符號框架，採視覺化邏輯樹操作法律三段論，於德國刑法§130(1)仇恨言論分類測試。結果顯示混合架構在召回與精準度上顯著優於無約束提示。同時保留可稽核性與可驗證決策。

速報

ConceptAgent：在黑盒下喚醒被抹除概念，揭露擴散模型語義控制的侷限

擴散模型廣泛用於文字轉圖，但概念抹除常只壓制未徹底移除。研究從去噪軌跡發現抹除破壞早期文字對齊但語義仍沿動態傳播，因模型後期仰賴噪聲狀態而出現繞過機會。提出ConceptAgent：免訓練黑盒多代理，透過替代導引噪聲起始喚醒被抹除概念，實驗證實在無參數與梯度存取下仍能準確可控喚醒。

速報

Headless 人工智慧浪潮：介面解綁、責任邊界與規則債務

過去垂直領域（會計、法律、醫療、採購等）軟體常將工作流程、領域規則與責任綁在同一個應用。通用型人工智慧代理人正在把介面與流程拆出，促成「headless」趨勢。文章主張：對部分業者放手介面是正確選擇，對另一些則可能破壞其價值捕捉，關鍵在於區分可移動的介面邊界和不得讓步的責任邊界。

速報

計算型 Token 經濟學：揭露 Token Economics 三難困境

本文把Token經濟學作為觀察大型語言模型（LLM）資源分配與定價的分析框架，強調從理論到實務存在重大缺口。作者提出「計算型Token經濟學」並定義Token Economics三難困境，指出細緻估值、低延遲執行與在不確定下達成配置最適之間存在結構性衝突。

速報

QQJ：量化質性判斷的生成式人工智慧評估新框架

生成式人工智慧快速發展暴露出評估方法的缺陷。QQJ提出以專家設計的多維量表為錨點，並用小量高品質標註校準大型語言模型評估者，使評估與人類判斷對齊。實驗顯示QQJ在一致性與診斷能力上優於既有自動或無約束LLM評估。並在文本與圖像生成任務上展現較高人類對齊度與穩定性，能識別幻覺與意圖不符等關鍵失誤。

速報

CBT-Audio：以語音語言模型量化認知行為治療中病人苦惱

心理治療中的認知行為治療多以口語對話進行。研究提出CBT-Audio資料集，收錄1802次病人發話並驗證轉錄與聲音的差異。使用多個開源語音語言模型比較輸入條件，結果顯示加入語音可提升苦惱評估，且在語句內容與語調不一致時效益最明顯。資料可支持未來模型在心理互動應用的評估。