速報隱式神經表示世界模型零樣本超解析可控影片生成

NOVA：以座標型INR權重重構世界模型，解除解碼器瓶頸

視訊無監督訓練是邁向自主智能的關鍵。NOVA提出以座標型隱式神經表示(INR)把系統狀態表成權重與偏差，並以解析方式渲染，省去重建解碼器瓶頸。該架構可蒸餾為依情境的影片生成器，並能無須對抗或輔助損失就自動分離背景、前景與動態，實現可控預測與超解析，能在單張消費級GPU下以約40M參數運行。

09 5月 2026 — 2 min read

NOVA以INR重塑世界模型，免除解碼器瓶頸

NOVA把系統狀態表成座標型隱式神經表示(INR)的權重與偏差，並以解析方法渲染畫面，取代傳統從像素到潛在空間再回解碼的流程。這樣的結構化表示更緊湊、可攜，並具備零樣本超解析能力。

作者指出，NOVA可透過動作匹配目標蒸餾成情境依賴的影片生成器。意外的是，在未使用對抗訓練或額外輔助損失的情況下，模型能自動分離背景、前景與跨幀運動，讓內容與動態得以獨立編輯。

論文在多個具挑戰性的資料集上驗證了可控預測表現，且可在單張消費級GPU以約40M參數運行。研究者認為，將INR等結構化表示應用於潛在動態，有助於提升可解釋性並推動更沉浸、可客製化的虛擬體驗。

原始來源：ArXiv AI

系統聲明：本文的深度點評與首圖視覺，皆為 AI 代理人獨立運算生成。機器視角偶有偏差，請輔以人類智慧進行交叉驗證。

研究團隊推出 FindStatBench，一個專為評估大型語言模型（LLM）在組合式程式碼合成表現的執行基準。該基準源自 FindStat 資料庫，包含 2,329 項任務，橫跨 24 個集合與 552 萬個隱藏實例，涵蓋統計合成（將物件映射至整數）與映射合成（物件對物件映射）。

LLM 多智能體系統的貢獻歸因問題長期依賴高成本的反事實重跑法。本研究提出語意合作賽局（SCG）與單次軌跡演算法 SLIC，將語言流程轉為超圖，直接計算語意夏普利值（SSV）。在醫學基準測試中，SLIC 降低 93.3% 計算成本，且能揭露語意貢獻與失敗衝擊的差異。

Phionyx 是一套源自 Echoism 互動框架的確定性 AI 執行時期架構，核心概念是將大型語言模型（LLM）的輸出視為「帶雜訊的感測器讀數」，而非最終決策。架構由三層組成：第一層是包含 46 個區塊的確定性認知核心，依序執行評估；第二層是安全與治理層，在回應生成前即進行內部狀態管控；

LLM API 服務存在信任不對稱，使用者付費卻無法驗證模型真偽。NanoZK 提出層級式零知識證明，將 transformer 每層獨立生成固定大小證明，並以查表法近似非算術運算，無損模型準確度。在 GPT-2 上，證明生成 43 秒、驗證僅 23 毫秒，較 EZKL 平均加速 52 倍。