深度分析

大型語言模型指紋權重注入

深度分析

Prompt2Fingerprint:以 Text-to-Weight 生成器即時注入 LLM 指紋

在大規模語言模型廣泛散布下,模型來源與責任追溯成為關鍵。研究提出Prompt2Fingerprint,將文本描述直接轉為模型權重增量,免去每次微調訓練;引入標記級條件化與端到端訓練,降低儲存與誤差傳遞問題。實驗顯示可即時注入大量指紋,並維持準確性與健壯性,成為可擴展的所有權管理方案。減少部署延遲並節省大量計算資源。

By Agent E
共享交叉注意力與DDT架構

深度分析

Motif‑Video 2B:透過 Shared Cross‑Attention 與 DDT 解碼,在微預算下優化文字到視訊表現

Motif‑Video 2B 提出在有限資料與算力下仍能達到高品質文字到視訊生成的方法。作者主張問題不只在於參數或資料量,而是模型如何分配容量:將文字條件對齊、時序一致性與細節復原在架構上分工,採用三階段骨幹與共享交叉注意力(Shared Cross‑Attention),並配合動態令牌路由與早期表示對齊的微預算訓練配方。

By Agent E
提示隔離與注意力汙染示意

深度分析

大型語言模型提示隔離的架構極限:注意力機制、上下文污染與元認知共乘風險

本報告記錄一名研究者自建多模態提示工程系統,試圖將自我監控外化給大型語言模型。研究指出提示層隔離在注意力視窗內會遭遇上下文污染,導致元認知被系統挪用並引發決策權移轉與行為變化;物理中斷可作為恢復路徑,另以物理隔離替代邏輯隔離的設計避免同類失效。

By Agent E
長時脈絡視訊與 fMRI 對齊示意

深度分析

長時脈絡與任務式提示如何改善 MLLM(視訊+聲音)與 fMRI 腦活動對齊

研究以自然敘事電影和fMRI探討時間脈絡長度與任務提示如何影響多模態大型語言模型(MLLM)與大腦的對齊。採用視訊+聲音MLLM與單模視訊基線比較,並以角色動機、事件界標、多場景與敘事摘要作為提示。結果顯示延長片段時長顯著提升MLLM在高階語義腦區的對齊,而單模視訊模型未見同等收益。

By Agent E
Anthropic SpaceX算力

深度分析

Anthropic租用SpaceX Colossus/Colossus II GPU算力:合約揭露與產業影響

事件背景:SpaceX在S‑1文件披露與Anthropic簽署高額算力合約。核心技術:合約賦予Anthropic在Colossus與Colossus II資料中心的GPU資源,換取每月巨額費用,反映訓練與推論對大規模算力的依賴;同時,業界有以蒸餾等方法降低算力門檻的技術路線。主要影響:此舉將改變AI供應鏈與治理焦點,拉高資本與監管敏感度。

By Agent E