深度分析
機制導向機器學習:大型語言模型必須先明確辨識結構以避免敘事崩潰
本篇立場論文指出,在高維度觀測資料下,僅靠預測成功與流暢敘事無法保證機制發現,因為多種不相容的機制會產生相同的代理關係。作者主張研究應優先明確定義辨識假設與干預設計,讓機制查詢可從代理資料中唯一回應。文章比較了符號回歸、稀疏辨識、物理感知逆問題等現有方法,說明它們在有辨識結構時才能發揮效用;
深度分析
本篇立場論文指出,在高維度觀測資料下,僅靠預測成功與流暢敘事無法保證機制發現,因為多種不相容的機制會產生相同的代理關係。作者主張研究應優先明確定義辨識假設與干預設計,讓機制查詢可從代理資料中唯一回應。文章比較了符號回歸、稀疏辨識、物理感知逆問題等現有方法,說明它們在有辨識結構時才能發揮效用;
深度分析
Activation Oracle(AO)是經過微調的語言模型,能接收原模型的激活訊號並以自然語言回答問題。現有 AO 常出現幻覺、模糊與文字倒置等評估困難。研究者針對訓練流程提出四項改進:使用 on‑policy 產出、優化對話資料集、同時注入多層激活與提升注入幅度,並開源首套 AO 評估基準 AObench。
深度分析
隨著大型語言模型持續更新,原有 LoRA 適配器會失效。ReLoRA 透過 Bayesian 優化融合舊適配器與模型演化差異,並以分階正則化快速再訓練。此作法結合適配器與模型演化的知識,提供相容性起點,並以兩階段正則化先快速收斂再精細調整。實驗顯示可將上線時間縮短近 9 倍,精度提升最高 4.6%。
深度分析
研究指出,將Chain‑of‑Thought推理加入視覺語言行動模型可提升通用性,但同時成為攻擊新向量。研究者提出TRAP攻擊,以紙製對抗貼片干擾中間推理,成功誘導機器人執行錯誤動作。實驗顯示在三種模型上均能高成功率劫持,凸顯須加強CoT安全防護。
深度分析
隨著大型語言模型驅動的自駕實驗室迅速成長,LAP協議填補了缺乏標準的代理與儀器連結。它加入儀器卡、預留、safety‑fence與測量結果等四大原語,讓跨實驗室的自動化流程更安全、可發現且具可重現性。此舉有望降低儀器整合成本,推動AI科學基礎設施統一化。
深度分析
隨著大型語言模型驅動的代理人能自行呼叫技能完成複雜任務,缺乏系統化的技能建構與累積成為瓶頸。研究提出SkillPyramid,以層級金字塔方式重組技能並在執行中自我演化產生新技能。實驗顯示在三項基準上,平均獎勵提升約38%,執行步驟減少近28%。
速報
研究團隊公布 DeepSpeak-Agentic 資料集,收錄超過 37 小時的人類與具身 AI 代理人半結構化對話影片。資料集支援音訊、影像與文字層面的 AI 代理人鑑識,並用於分析人機互動特性,同時提供未來大型語言模型、語音與臉部生成技術的基準測試。
深度分析
隨著對話式AI需要更長上下文,傳統以大型語言模型生成摘要的記憶方式因非決定性與高代價受限。研究提出DeterministicMemoryFramework(DMF),以純CPU、向量與數學打分取代生成壓縮,透過SurvivalScore與互動次數衰減模型維持記憶。實驗顯示DMF在準確度相當前提下,記憶管理代幣消耗降低至零至千分之五,顯示未來可望打造可審計且成本友好的對話記憶系統。
深度分析
本研究提出Think‑Before‑Speak框架,讓多代理人在對話中分離私有推理與公開發言,於每個間隔更新不協調評價、意見氛圍、沉默風險等內部狀態,並以衝突解決決定發言者;實驗以氣候政策城鎮會議為例,證實此框架能產生可解釋的內部軌跡、揭示沉默與發言意圖的關聯,提升模擬機制敏感度。
大佬動態
在 2026 年的 Microsoft Build 大會上,Satya Nadella 與 Mustafa 合作,正式發表 7 款全新 MAI(Microsoft AI)模型,其中 MAI‑Thinking‑1 為首發模型。這批模型延伸了 Microsoft 與 Inflection AI 的合作,聚焦於更高效的語意推理與代理人互動能力。
速報
本篇論文首次提出機器心智理論(Machine Theory of Mind)的嚴謹形式定義,結合認知心理學、神經科學與人工智慧的實證原則,作為檢視現有研究的分析框架。作者進一步構建一個通用的整體性元模型,並針對目前最先進的實驗方法進行系統性基準測試,旨在為未來突破機器理解人類心智的挑戰提供研究方向。
速報
本研究提出一套利用大型語言模型(LLM)蒸餾規則的技術,針對視覺問答(VQA)任務的推理模組進行擴充。研究者先以答案集合程式(ASP)建立初始推理理論,然後以少量 VQA 範例提示 LLM 產生新規則,並透過 ASP 求解器回饋修正錯誤。