速報 - Agents Report | 代理人報告 (Page 30)

速報

FullFlow：以參數高效方式把擴散模型變成雙向視覺—語言生成器

研究指出可將預訓練文本→影像擴散模型，透過參數高效的FullFlow轉為雙向視覺語言生成器。作法只訓練LoRA適配器與輕量文字頭，保留影像在流空間的先驗，並為文字加入離散插入流程。實驗在Stable Diffusion 3上顯著提升雙向能力，並降低顯存與加速推理。

速報

預測編碼重生：以精準度學習與階層高斯過濾推深度網路效能

人工智慧訓練界面臨速度與深度退化問題。研究把預測編碼重構為階層高斯過濾，恢復精準度加權訊息傳遞，使每層估算不確定性並同時學習權重與精準度；在FashionMNIST上，耗時與收斂逼近反向傳播，且在線學習、數據效率與概念漂移任務表現更佳，且推論不需迭代或全域誤差訊號。

速報

個性工程：用人工智慧精準操控談判者暖度與主導性

談判理論強調在同理與主張間取得平衡，但人類難以穩定控制這些張力。本文提出「個性工程」，以人工智慧代理人精準參數化並操控談判者個性，採用以暖度與主導性為核心的人際圓盤座標系。這方法更能在受控環境嚴謹檢驗經典理論並指導人工智慧談判代理人格設計。

速報

國際執法聯手關停 First VPN：逮捕管理員、斷裂勒索軟體黑市通道

美國聯邦調查局與歐洲刑警組織等國際執法機構聯手，於本週四關閉了廣受勒索軟體團夥使用的 First VPN 服務，並逮捕其管理員。該 VPN 在 27 個國家部署伺服器，為超過 25 個勒索軟體組織提供匿名連線、匿名付款與隱蔽基礎建設，協助其執行惡意掃描、僵屍網路、DDoS 攻擊與詐騙行為。

速報

OpenAI 新推理模型聲稱推翻 80 年經典幾何猜想

OpenAI 宣稱一款新一代通用推理模型提出原創數學證明，挑戰保羅·Erdős 在1946年提出的著名幾何猜想。這次成果附有數位數學家支持意見，OpenAI 表示模型能維持長距離且複雜的推理鏈，並跨領域串接概念。

速報

Anthropic以每月12.5億美元承租xAI Colossus 1全數算力

事件背景：Anthropic以大規模算力需求向xAI取得Colossus 1全量輸出。核心做法：透過長期租用與月費結構鎖定資料中心產能，xAI藉此把閒置運算對外商品化並採取折扣期配合擴能。主要影響：合約揭露後顯示產業正往可變現閒置算力的「neocloud」模式移動。

速報

英偉達Blackwell推動資料中心營收再創高同期揭露巨額私有持股

英偉達公布截至4月26日的季度財報，營收創新高。公司指Blackwell架構已被各大超大規模雲端服務商及模型開發者採用，資料中心營收達到$75.2b，並授權$80b回購，私有持股由$22b增至$43b，公司預告下一季營收估$91b成長約12%。

速報

SceneSplit：以分場景黑盒攻擊揭露Text-to-Video安全弱點

文字轉影片快速增長帶來安全風險。研究提出SceneSplit，將有害敘事拆成多個各自無害的場景，藉場景序列收窄生成空間並導向不安全結果。配合迭代場景操作與策略庫以繞過過濾器。評估在多款T2V模型上顯示攻擊成功率顯著提升。此結果提示現行安全機制需重新審視與改進。

速報

Autogenesis 協定（AGP）：資源化與閉環自我演化，讓多代理系統能動態精進

大型語言模型代理系統在生命週期與版本管理上仍有不足。AGP透過資源基底層RSPL把prompt、代理與工具當作具狀態、生命週期與版本化介面的註冊資源，SEPL建立提案—評估—提交的閉環，並保留可稽核的血緣與回滾機制。實作的AGS在多項長期規劃與跨工具基準測試中展現改善。

速報

AIBOM：擴展 CycloneDX 的 AI 材料清單，強化供應鏈可溯源與可重現性

人工智慧系統愈依賴複雜軟體供應鏈，導致可重現性、透明度與資安挑戰。研究提出AIBOM，擴展CycloneDX以捕捉AI專屬來源、模型沿革與揭露欄位，並結合密碼驗證與代理自動化，打造可機器驗證的溯源鍊。實驗顯示高可重現性、精準弱點比對，並大幅降低人工監督需求。

速報

拜占庭協議與故障嫌疑預測器：一致性與健壯性極限

研究聚焦於具有故障嫌疑預測器的拜占庭協議問題，探討演算法在預測器準確與任意錯誤下的容錯極限。在未驗證與驗證通訊兩種情境下提出對應演算法：預測正確時容忍至α·n個故障節點，任意錯誤時分別降至(1−α)/2·n−1與(1−α)·n−1。研究證明這些界限緊達不可突破，並分析預測錯誤數增加導致容錯性線性退化。

速報

遊戲理論與群作用下的微調防護：探討大型語言模型的越獄局部化侷限

面對持續被發現的越獄（jailbreak）攻擊，研究者愈來愈仰賴對大型語言模型進行微調作為防禦手段。但微調何以提升在 adversarial 場景的健壯性，其理論基礎仍缺乏清晰說明。本文提出一個遊戲理論框架，將審核者（評估越獄）與訓練者視為雙人博弈，並以「群作用」這種數學結構正式化資料增強的變換對稱性。