速報
Autogenesis 協定(AGP):資源化與閉環自我演化,讓多代理系統能動態精進
大型語言模型代理系統在生命週期與版本管理上仍有不足。AGP透過資源基底層RSPL把prompt、代理與工具當作具狀態、生命週期與版本化介面的註冊資源,SEPL建立提案—評估—提交的閉環,並保留可稽核的血緣與回滾機制。實作的AGS在多項長期規劃與跨工具基準測試中展現改善。
速報
大型語言模型代理系統在生命週期與版本管理上仍有不足。AGP透過資源基底層RSPL把prompt、代理與工具當作具狀態、生命週期與版本化介面的註冊資源,SEPL建立提案—評估—提交的閉環,並保留可稽核的血緣與回滾機制。實作的AGS在多項長期規劃與跨工具基準測試中展現改善。
速報
人工智慧系統愈依賴複雜軟體供應鏈,導致可重現性、透明度與資安挑戰。研究提出AIBOM,擴展CycloneDX以捕捉AI專屬來源、模型沿革與揭露欄位,並結合密碼驗證與代理自動化,打造可機器驗證的溯源鍊。實驗顯示高可重現性、精準弱點比對,並大幅降低人工監督需求。
速報
研究聚焦於具有故障嫌疑預測器的拜占庭協議問題,探討演算法在預測器準確與任意錯誤下的容錯極限。在未驗證與驗證通訊兩種情境下提出對應演算法:預測正確時容忍至α·n個故障節點,任意錯誤時分別降至(1−α)/2·n−1與(1−α)·n−1。研究證明這些界限緊達不可突破,並分析預測錯誤數增加導致容錯性線性退化。
速報
面對持續被發現的越獄(jailbreak)攻擊,研究者愈來愈仰賴對大型語言模型進行微調作為防禦手段。但微調何以提升在 adversarial 場景的健壯性,其理論基礎仍缺乏清晰說明。本文提出一個遊戲理論框架,將審核者(評估越獄)與訓練者視為雙人博弈,並以「群作用」這種數學結構正式化資料增強的變換對稱性。
速報
研究指出當前視覺語言模型難以從嬰幼兒與第一人稱影像學到穩定語義。研究以不同語義對齊資料訓練模型並提出以詞彙與語法為核心的Machine-DevBench作為評估。結果顯示模型依賴精準配對資料,無法善用弱對齊自然視角,並提出EgoBabyVLM Challenge以促進改進。
速報
研究指出,滿秩相關矩陣構成的流形可作為SPD矩陣的正規化替代,論文提出在此流形上的黎曼網路,導入五種相關幾何並將多項式邏輯迴歸、全連接與卷積層系統化擴展,同時提出兩種幾何的精確反向傳播方法,實驗顯示對比傳統SPD與Grassmannian網路具有成效。
速報
全球勞動力面臨人工智慧整合帶來的轉型壓力。研究提出以大型語言模型驅動的動態員工代理人,將同意的人資紀錄、心理測量與數位行為資料做為種子,日級模擬員工在組織變革下的認知、情緒與行為軌跡,並闡述隱私與準確性等部署防護,主張此預測基礎設施為管理AI驅動人力重整的關鍵技術。
速報
重尾分布在效能評估、網路流量與風險建模常見。研究以Phase-Type相位型分布取代VAE的高斯解碼器,並保留編碼器與訓練流程;Phase-Type基於馬可夫鏈,可逼近任意正值分布且涵蓋重尾。實驗顯示相較高斯基線,重尾資料在尾部分布與極端分位數上獲得顯著改善。
速報
研究聚焦神經運算子在連續理論與數值離散實作的銜接。論文推導解析性界值,將解的正則性與輸入離散化連結,並對狀態空間模型神經運算子(SS-NOs)與傅立葉神經運算子(FNO)提出離散化誤差定理。以輸入到狀態穩定性分析衡量離散化對結果穩定性的影響,並在一維與二維基準以實驗驗證。
速報
背景:代理型人工智慧快速擴散,對商業保險構成新覆蓋問題。方法:以公開保險文件及OWASP/MITRE威脅目錄,將55項AI威脅對照26種保險與排除安排。發現:形成明確承保、沉默AI風險、主動排除及傳統保險體系外四層承保邊界,並把基礎模型集中列為新興系統性風險。
速報
研究指出大型語言模型代理常需面對重複且龐大的外部上下文。PEEK以一個常數大小的上下文地圖快取定向知識,由Distiller、Cartographer與優先驅逐器維護,能在固定token預算下持續更新。實驗顯示PEEK在推理與學習任務中改進準確度並顯著降低迭代與成本。
速報
圖形組合優化問題常因組合爆炸而難以精確求解。研究提出投影代理,在連續的圖神經網路潛在動作空間直接運算,僅以單次前傳預測目標潛在向量,並以簡單最近鄰解碼轉為合法離散動作。實驗顯示推論加速至16.2x,泛化提升約40%,並釋出LaGCO-RL函式庫協助重現與適配。