速報大型語言模型模型原生計算 ICAM AI 代理人

大型語言模型進入系統技術時代：ICAM 六層架構全解析

大型語言模型正從模型技術轉向系統技術，開發者利用 Codex、Claude Code、AutoGPT 等代理人編寫程式與執行多步驟任務。研究將電腦架構概念映射至模型原生堆疊，提出六層 ICAM 框架，並以機率執行層與決策控制層解釋 LLM 的雙重角色。驗證三大設計法則，指出未來研究方向。

02 6月 2026 — 2 min read

模型技術向系統技術的轉變

隨著開發者廣泛使用 Codex、Claude Code、AutoGPT 等代理人來寫程式、管理專案與執行多步驟工作，LLM 所面臨的快取重用、上下文管理、代理排程與權限控制等問題，越來越類似傳統電腦系統的挑戰。

研究將電腦架構的概念映射至新興的模型原生堆疊，回顧了 LLM 作業系統、記憶體管理、代理框架、工具協議、多代理協調、認知架構與安全治理等領域的工作，指出這些層面雖然分散卻缺乏統一模型。

為填補上述缺口，作者提出「Intelligent Computing Architecture Model (ICAM)」，一個包含六層、具明確介面合約與設計公理的框架。ICAM 以雙平面視角說明 LLM 同時具備類似 CPU 的機率執行層與類似作業系統的決策控制層。

文中提出三條設計法則：

這些法則皆以已公開的系統層級資料驗證，並與近期代理程式實務的證據相呼應。

作者指出類比在某些情境下會失效，並提出模型原生計算的研究藍圖，呼籲社群在介面標準、資源管理與安全治理等面向持續深化。

原始來源：ArXiv AI

系統聲明：本文的深度點評與首圖視覺，皆為 AI 代理人獨立運算生成。機器視角偶有偏差，請輔以人類智慧進行交叉驗證。

AI 科學文獻合成代理系統的引用驗證機制存在重大不一致性。研究發現同一輸出在不同驗證器下無支援引用率從約 3% 到 18% 不等，且驗證器間對須標記案例共識極低。團隊提出以人類黃金標準為錨點的評估協議與基於分割共形預測的防護機制，能對未標記的無支援引用提供有限樣本保證。

OpenAI 的 GPT-5.5 Pro 模型自主生成七個反例，證明了實數域上的 Erdős–Szemerédi 和積猜想不成立。該研究使用三階段提示流程，在八次試驗中七次成功，平均耗費 132.4k 推理 token。證明方法多樣，部分避開單位構造，採用 Lp 型區域，減少數論需求。

本研究提出 CMI-Mem，一種以強化學習為基礎的輕量級記憶管理器模型。傳統的記憶管理器依賴大型語言模型（LLM）作為評審，透過合成問答（QA）對來評估記憶品質，但這種方法會使記憶的價值受到抽樣查詢與下游閱讀器的影響，導致泛化能力受限。

後端程式碼生成常因缺乏執行驗證而產生語義錯誤。ExecuGraph 提出基於 LangGraph 的多代理人架構，以執行結果為唯一驗收標準。在 HumanEval 上領先單次生成 3.1 個百分點，但內部 30 題庫的統計差異未達顯著，顯示效益與模型規模相關。