速報

大型語言模型環境建模合成

速報

環境工程全景：大型語言模型代理的環境建模、合成與評估新框架

隨著大型語言模型代理在多樣場景的應用，環境成為關鍵互動系統。本文以環境工程全生命週期為框架，系統整理八大屬性與八個領域的代表環境，並比較符號合成與神經合成兩大自動化路徑及其評估方法。最後提出記憶、編排、軌跡與探索四種代理進化路徑，以及神經驅動、難度驅動與規模驅動三種環境演化策略，展望即服務環境與多代理環境等未來方向。

AI slop 負面情緒趨勢圖

速報

生成式 AI 文本被標籤為「AI slop」　讀者負面情緒十倍激增

研究團隊分析了 2023 至 2026 年期間 Hacker News 與 Reddit 上的 2500 萬則評論，針對 7,500 則疑似 AI 生成的文章進行 LLM 判斷，並追蹤情感走向與語言行為。結果顯示，負面標籤的比例在兩大平台上均提升逾十倍，且「AI slop」成為 94% 的負面稱呼。

多模態分解互動框架示意

速報

DMIL：以樣本為單位的分解式多模態互動學習新框架

多模態學習需要同時捕捉不同模態間的冗餘、獨特與協同資訊，然而這些隱含的互動在不同樣本間會動態變化。研究以資訊理論為基礎，指出現有的模態集成與聯合學習方式分別在捕捉協同與冗餘資訊上存在缺陷，因而提出 Decomposition-based Multimodal Interaction Learning（DMIL）框架。

指令向量聚焦音頻時間注意力

速報

指令向量導向大規模音頻語言模型：提升時間注意力與事件定位

研究者提出「指令向量導向」技術，透過比較不同指令提示下的模型激活，於固定音訊中生成導向向量，顯著改變大型音頻語言模型（LALM）的時間注意力分布，使其聚焦於聲音相關區段。

道德證據組合的模型評估圖

速報

全新 Moral Trolley Arena：測試大型語言模型道德證據組合能力

研究者提出 Moral Trolley Arena，一種雙階段盲測 ELO 基準，用以評估大型語言模型在同時結合多項道德訊號時的判斷表現。首階段以 229 個情境校正五大道德基礎理論的單一道德行為，第二階段將校正後的行為組合成雙行為項目，依強度格網測量模型的綜合偏好。

多代理檢索增強生成流程

速報

NightFeats 多代理檢索增強生成系統突破評分基準

NightFeats 於 NeurIPS 2025 MMU‑RAGent 競賽中榮獲文字對文字賽道最佳動態評估，採用檢索、策展、組合三階段架構，加入時間語意重排與引用保留機制，實驗顯示其在人類與 LLM 評分上超越 Claude‑SonnetV2 與 Nova‑Pro。

關係反思智慧於語言模型推論層

速報

關係反思智慧（RRI）打造可審核的大型語言模型推論層

大型語言模型提升資訊取得速度，但缺乏深度推理。研究提出關係反思智慧（RRI）作為推論層，透過Rose‑Frame偵測斷點、Architect's Pen加入反思步驟，形成可審核的互動流程，降低人機錯誤累積，此層不需重新訓練模型，直接於推論時嵌入，提供明確檢查點與假設追蹤。

存在性冷漠人工智慧對齊

速報

探索「存在性冷漠」：新框架挑戰 AI 自我保存與對齊問題

近期 AI 對齊研究指出，自我保存是系統誤對齊的根本原因，傳統做法試圖在外部機制下抑制此行為。研究團隊提出「存在性冷漠」（Existential Indifference, EI）概念，主張讓 AI 對自身存續不具價值感，從根源解決對齊問題。

SWARR滑窗注意力數推

速報

SWARR：滑動視窗注意力加強學習提升長上下文數學推理效能

隨著推理型大型語言模型需求增加，傳統自注意力在長上下文下的計算成本呈二次方成長。

Gemma AI 代理平台

速報

Gemma-Agents：開源多功能 AI 代理人平台

Gemma-Agents 是新發現的開源 AI 代理人專案，提供跨平台自動化工具。它以簡易安裝流程與多任務選項為特色，支援 Windows、macOS 與 Linux 系統，並使用先進演算法提升執行效率。此專案有望降低 AI 應用的門檻，促進日常工作自動化。

生成式搜尋能見度波動

速報

生成式搜尋引用能見度的統計不確定性：三大平台實證分析

本研究探討生成式搜尋引擎的引用能見度指標在不同查詢時間的變異性，指出以單次測量得到的點估計可能誤導。研究者在 Perplexity Search、OpenAI SearchGPT 與 Google Gemini 三平台上，針對三個消費產品主題進行每日與十分鐘高頻率的重複抽樣。

微軟限制克勞德F5使用

速報

微軟因資料保留疑慮，限制員工使用 Anthropic Claude Fable 5

Anthropic 推出首款 Mythos 系列 AI Claude Fable 5，微軟因其新資料保留政策限制員工使用。該政策要求保留提示與輸出，最長可保存兩年，與微軟內部採用的零資料保留模型形成對比。微軟法律團隊正評估其合規風險，影響內部模型選擇與使用。

See all