速報
FLARE 框架:結合混合注意力與擴散式生成的高效大型語言模型轉換
自回歸大型語言模型在實務應用上取得成功,但逐字解碼仍是低延遲部署的瓶頸。近來的效能優化研究分為兩條路徑:透過混合注意力架構降低單次模型呼叫成本,以及利用擴散式語言模型(dLLM)以平行去噪方式減少序列步驟。FLARE 提出一套系統化的轉換框架,將混合注意力 LLM 轉換為同時支援自回歸驗證解碼與擴散平行去噪的模型。
速報
自回歸大型語言模型在實務應用上取得成功,但逐字解碼仍是低延遲部署的瓶頸。近來的效能優化研究分為兩條路徑:透過混合注意力架構降低單次模型呼叫成本,以及利用擴散式語言模型(dLLM)以平行去噪方式減少序列步驟。FLARE 提出一套系統化的轉換框架,將混合注意力 LLM 轉換為同時支援自回歸驗證解碼與擴散平行去噪的模型。
速報
分散式事件系統在即時資料傳輸、物聯網與雲端微服務中扮演關鍵角色,但其鬆耦合與非同步傳遞也擴大了攻擊面。研究提出 SECUREVENT,結合驗證傳輸、主題授權、簽名事件等傳統防護與線上異常偵測、圖形行為特徵、複雜事件規則、聯邦學習與對抗式機器學習治理的混合式安全監控架構。
速報
傳統作業系統以確定性程式設計為前提,無法完全支援長期目標導向、具機率推理與工具動態調用的 AI 代理。研究提出「代理人作業系統(Agent Operating System,AOS)」,將代理控制平面整合至現有作業系統,或逐步接管特定功能。AOS 的核心職責包括排程、上下文與記憶管理、工具與能力註冊、政策與信任執行、可觀測性與稽核。
速報
研究聚焦於大型語言模型的偏好對齊問題,指出傳統以單一獎勵最大化的方式難以處理循環或非傳遞性的人類偏好。作者提出一種結合 SFT 正則化與對抗式政策探索的顯式探索式 NLHF 演算法,保留迭代式直接政策優化的架構,同時在理論上達到 O(√T) 的遺憾界限,若使用最小最大值 oracle 可進一步降至 O(log T)。
速報
隨著使用者跨語言閱讀需求增加,多目標跨語系文本摘要(MTXLS)成為關注焦點,但相關研究仍相對薄弱。研究團隊推出了 MEA 基準,涵蓋 24 種目標語言,並比較端對端與流水線式方法在不同大型語言模型(LLM)上的表現,結果顯示 MTXLS 的品質仍遠低於單語英文摘要。
速報
隨著軟體工程師工作越來越偏向指揮 AI 代理而非手寫程式碼,產業已顯現出顯著的自動化趨勢。Anthropic 的經濟指數顯示,Claude Code 互動中有 79% 為自動化,相關研究亦指出程式設計師工作中約有 75% 的活動已被 AI 涵蓋。
速報
研究者提出「強化隨機流映射」(Strong Stochastic Flow Maps, SSFMs)框架,直接學習加性噪聲隨機微分方程(SDE)的強解映射,將確定性流映射概念延伸至隨機情境。透過多項式近似布朗運動並證明路徑收斂,SSFMs 可在無需模擬的情況下訓練擴散模型的解映射。
速報
多代理系統的溝通已受 Agent‑to‑Agent (A2A) 與 Model Context Protocol (MCP) 標準及去中心化身分驗證框架支援,但仍缺乏在組織信任邊界內,能在不解密負載的前提下進行語意路由的機制。
速報
本研究探討在企業多代理系統中,是否應根據問題類別動態選擇協調策略(共識、辯論、合成或單一代理)而非全域固定。
速報
近期的視覺語言模型在影片的實體推理、時間一致性與情境規劃上表現不佳。研究團隊推出以推理為核心的訓練資料集 pause‑and‑think‑T,要求模型在產生答案前先暫停、檢視視覺證據並形成簡潔可執行的回應。
速報
研究團隊提出 StressDream,透過優化擴散式影片世界模型的初始噪聲,使想像的未來影像朝向高衝擊但仍合理的結果發展。此方法結合視覺語言模型提供的語意梯度與合理性目標,避免噪聲偏離分佈。實驗以自駕與機械手臂的最先進影片模型驗證,證明可在推論時以文字指定失敗情境,協助更穩健的策略評估與改進,找出可能導致不良結果的動作。
速報
微調雖能讓基礎模型適應特定任務,但常會削弱預訓練時獲得的通用能力。為了同時提升目標任務表現與保留非目標能力,研究團隊提出 Foundation Preserving LoRA(FoLoRA),一種以遺忘懲罰與任務效用為指標的優化方法。