深度分析
Iteris 代理式 AI 系統:以 explore‑plan‑execute 流程突破計算數學開放問題
計算數學的開放問題長期需要結合數值實驗與證明構造。研究團隊推出 Iteris 代理式研究系統,以 explore‑plan‑execute 迴路自動生成數據、構造與證明草稿,經專家修正後得到兩項新結果:CG 與隨機座標下降在冪律譜上的相位圖,以及 QR 分解在低相干情況下的反例。此案例顯示 AI 能在數學工作流中提供實質助力,但仍需人工驗證。
深度分析
計算數學的開放問題長期需要結合數值實驗與證明構造。研究團隊推出 Iteris 代理式研究系統,以 explore‑plan‑execute 迴路自動生成數據、構造與證明草稿,經專家修正後得到兩項新結果:CG 與隨機座標下降在冪律譜上的相位圖,以及 QR 分解在低相干情況下的反例。此案例顯示 AI 能在數學工作流中提供實質助力,但仍需人工驗證。
深度分析
MiniMax‑M2 系列提出以 Mixture‑of‑Experts(MoE)與「迷你啟動」為核心的設計路線,主張在每個 token 僅啟動小量參數即可達到實務級別的代理式智慧。
深度分析
隨著代理式AI系統日益複雜,傳統以每次推論耗能為單位的評量已失真。研究提出A-LEMS框架,將單位重新定義為每成功目標能源(EpG),並引入編排開銷指數(OOI)衡量多步驟編排成本。實驗顯示,代理工作流的平均EpG高出線性基線4.33倍,且在工具輔助任務中OOI可低於1,突顯編排結構是能耗關鍵因素。
Gemini 3.5 Flash
在 Google I/O 上,谷歌發表 Gemini 3.5 Flash 與 Gemini Omni Flash。Gemini 3.5 Flash 為 Gemini 3.5 系列的首款 Flash 模型,在多項基準測試上超越先前的 3.1 Pro,並在某些測試中與 OpenAI 的 GPT‑5.5、Anthropic 的 Opus 4.7 競爭。
深度分析
本研究探討代理式 AI 如何壓縮網路攻擊流程,透過降低偵查、釣魚、漏洞利用等成本,加速從落腳點到取得根權。案例以 2026 年 Linux 核心「Copy Fail」漏洞說明攻擊鏈的加速效應,並預測 2026‑2028 年企業與德國中小企業的安全挑戰與防禦優先順序。同時提出身分驗證、修補速度與容器硬化等六項防禦建議。
深度分析
在SAP計畫併購德國新創PriorLabs的情境下,焦點落在表格基礎模型(TFM),它專處理資料表與資料庫中的結構化資料。TFM被視為比大型語言模型更貼近企業會計、人資與採購流程。SAP同步限制未授權代理接入,將影響企業採用代理式AI的路徑與生態。
深度分析
隨著代理式 AI 越趨成熟,實驗室部署仍面臨安全與可靠性挑戰。SciFi 以隔離環境、三層代理迴圈與自評執行機制,實現安全、輕量且全自動的科學任務執行。結果顯示,研究者可在最少人工干預下完成端對端工作流程,將例行工作交給 AI,專注創新研究。
深度分析
有限元素分析是工程模擬的基礎,然而編寫與驗證程式需跨領域專業。研究者開發 ALL-FEM,透過微調的大型語言模型與代理式框架自動產生、除錯 FEniCS 程式,並在 39 個多物理基準測試中取得 71.79% 的成功率,顯示小型模型結合代理機制即可有效自動化有限元素工作流程。
深度分析
隨著 AI 應用推升 HPC 能耗,傳統持續學習功能不足。LIFE 框架以代理式架構結合 orchestrator、Agentic Context Engineering、創新記憶體與資訊格子學習,提升能源效率與即時適應能力。實驗顯示在 Kubernetes 叢集上能即時偵測並緩解微服務延遲尖峰,預示未來 AI 系統將更具永續與彈性。
Claude
HumanX AI 大會聚焦代理式 AI 與 Claude,顯示企業對自動化聊天機器人的需求升溫。Claude 以其在商務與程式碼任務上的表現獲得廣泛好評,對比 ChatGPT 受挫。OpenAI 為保護市場領導地位,推出新訂閱方案並加強 Codex 功能,預示競爭格局持續演變。