深度分析
WaveFilter:利用離散小波轉換提升擴散模型長上下文 KV 快取效能
WaveFilter以小波轉換改良擴散語言模型的KV快取,結合粗粒度語意概覽與多尺度遞迴篩選,顯著降低長序列計算成本,同時提升生成品質與效能,為長上下文任務提供更實用的解決方案。結合Fast‑dLLM後,WaveFilter在LongBench基準提升2%準確率,且吞吐量近,降低長上下文部署門檻。
深度分析
WaveFilter以小波轉換改良擴散語言模型的KV快取,結合粗粒度語意概覽與多尺度遞迴篩選,顯著降低長序列計算成本,同時提升生成品質與效能,為長上下文任務提供更實用的解決方案。結合Fast‑dLLM後,WaveFilter在LongBench基準提升2%準確率,且吞吐量近,降低長上下文部署門檻。
深度分析
隨著低位元梯度訓練在大型語言模型中成為主流,研究者探討在B位元量化的隨機一階預言機下,優化問題可等價於壓縮高斯均值估計,證明T·B=Ω(d)與T=Ω(σ²d/ε²)的資訊理論下界,並在八個POMDP環境驗證相變現象,顯示傳輸率可降低至傳統上限的1/19,為未來AI系統的位元效率提供基礎。
深度分析
隨著大型語言模型被廣泛用於工具增強代理,對於需要多答案的資訊查詢提出了長程搜尋與探索的挑戰。研究提出 SPADER 框架,結合步驟同儕優勢的無評論員信用分配與多樣性導向的探索獎勵,促使代理持續發掘長尾實體。實驗顯示在四大多答案 QA 基準上,召回率與 F1 均優於既有方法。
深度分析
Perplexity AI於Computex 2026推出首款混合本地‑雲端推論編排器,系統可即時判斷每項AI子任務在使用者裝置或前沿雲模型執行,保障金融與醫療等敏感資料留在本機,同時將高階推理交由雲端完成,降低成本並提升回應速度,預示AI運算與資料主權的未來走向。
深度分析
企業在導入 AI 代理人時,常把焦點放在模型效能上,卻忽略了運行時的治理與授權機制。本文以 VentureBeat 的報導為基礎,結合 AWS NanoCo、Workday Sana、Snowflake Horizon Context 等案例,解析為何大多數組織在建置錯誤的解決方案。
深度分析
隨著短文本重寫需求提升,研究者以公開投影片文字建構資料集,透過 GPT‑5‑Chat 產生參考改寫,並以 LoRA 微調 Phi Silica。共收集93萬對短句,評估以 GPT‑5‑Chat 作為評審,偏好勝率提升至68%以上。結果顯示模型在語意保留與幻覺降低上明顯優於基線,縮小與雲端大模型差距。
深度分析
本研究以單眼手機影片為輸入,結合SAM2 2D掩膜與單目高斯重建,透過圖形測地熱核在高斯中心圖上傳播使用者提示,將開放詞彙的2D分割提升為持續跨視角的3D掩膜,並有效抑制相鄰卻不相連物件的幾何洩漏,為輕量化3D場景分割提供新方向。預期將加速AR/VR應用的即時場景理解與機器人導航。
深度分析
微軟在Build大會公布AI助手Scout,能讀取Teams訊息、行事曆與郵件,自動排程、回覆與任務分派。此舉有望提升辦公效率,同時也帶來安全與工作自動化的風險。微軟以小規模客戶先行測試,並提供管理員監控功能,以防止提示注入攻擊。若使用者設定個人目標,Scout甚至能主動安排會議與提醒。
深度分析
OpenAI 推出 Codex 最新升級,加入 Sites 與 Annotations 以及六大角色插件,讓非程式員也能直接在瀏覽器上編輯報表與自動化工作流程。新功能透過局部資料範圍機制避免全檔重寫,並提供即時網頁應用,預計加速企業 AI 採用,同時引發資料主權與供應商鎖定的討論。
深度分析
微軟在 Build 大會推出 MXC,將 AI 代理人執行層以作業系統核心管控,透過政策宣告與沙盒隔離限制存取,讓企業可在 Windows 上安全部署自動化代理,降低攻擊面並提供可稽核身份。同時整合 Defender、Entra、Intune 與 Purview,形成企業控制平面,預計將加速 AI 代理人在企業環境的實務應用,改寫安全治理格局。
深度分析
企業在導入 AI 代理人時常因缺乏共享情境層而產生資料孤島。微軟推出 Microsoft IQ,整合四大情境來源,並配合開源 Rayfin SDK 將代理建構的應用直接部署至 Fabric,確保資料回流同一平台,提升治理與可信度。此舉預示 AI 代理人將以統一情境為基礎,重塑資料治理與應用部署模式。
深度分析
Microsoft在Build2026公布ProjectSolara,採用Android作為底層的AI代理人作業系統,展示桌面概念機與胸牌式穿戴裝置,雖不會自行出貨,卻提供給硬體夥伴作為參考設計,預期推動AI裝置市場多元化,並挑戰傳統Windows版圖。