深度分析
守恆量學習比較:CDN、多項式與結構化能量網路在哈密頓系統中的還原能力
背景:深度模型能短期預測物理軌跡但可能違反守恆。方法:研究以守恆發現網路與結構化能量網路直接從軌跡學習不變量,並檢驗訓練排程與雜訊敏感度。結果:結構化先驗在匹配系統時能極好重現解析能量,但在有狀態雜訊或訓練不足下,黑箱式或多項式方法表現各有利弊。
深度分析
背景:深度模型能短期預測物理軌跡但可能違反守恆。方法:研究以守恆發現網路與結構化能量網路直接從軌跡學習不變量,並檢驗訓練排程與雜訊敏感度。結果:結構化先驗在匹配系統時能極好重現解析能量,但在有狀態雜訊或訓練不足下,黑箱式或多項式方法表現各有利弊。
深度分析
在資料稀缺與隱私壓力下,GenAI‑FDIA以20種物理制約生成模型合成電力系統的假資料注入。研究在三個IEEE測試系統上評估,揭露標準化後的物理解投影會使攻擊向量移位,並提出推理階段的harmoniser與warm‑up修復策略以恢復隱匿性。
深度分析
近年以可驗證獎勵的強化學習(RLVR)在提升大型語言模型單一路徑準確度上成效明顯,但常見模式銳化導致樣本覆蓋不足。本文介紹SAGE框架,藉由在reverse-KL的錨分布上加入可控的引導函數q(x,y),在保留穩定性的同時有系統地擴展經驗支持(empirical support)。
深度分析
變分自編碼器(VAE)常被當作離散碼本使用,但傳統指標如 ELBO、活躍單位與互信息只檢視邊際使用,無法確認解碼器是否以與編碼器相同的碼簽來「讀取」潛在表示。
深度分析
研究發現對LLM的大量檢索下,表面>99%成功率可能等同隨機。論文提出Bits-over-Random(BoR)=log2(Pobs/Prand)衡量檢索選擇性,指當λ=K·R̄q/N超過3–5時選擇性崩潰,建議以BoR指引K與工具載入策略。
深度分析
本文改寫自 ArXiv 的研究《Lying Is Just a Phase》,報導研究團隊透過CAP E(Capability Coupling Analysis of Phase Emerence)框架,分析63款、16個家族的語言模型,揭露推理能力與真實性(truthfulness)之間存在清晰的相變:在家族依賴的臨界規模Nc之前,能。
深度分析
EPIC針對美國多家大型資料蒐集者檢查退出機制,發現廠商用藏匿連結、分散或重複表單、預設同意、付費牆等設計阻礙用戶退出。報告指出,像OpenAI、Meta、Google與人肉搜尋業者未提供清楚或實際的退出途徑,導致個資持續流通,並可能帶來隱私與人身安全風險。
深度分析
研究指出語言模型內部的特徵並非靜態,而有明顯的「生命史」:誕生、存續與消亡。作者以稀疏自編碼器(SAE)在多個訓練檢查點追蹤特徵的發火模式與解碼方向,識別出一小群在訓練早期(約前1%)就已成形的「載體骨幹」。這些持久特徵不但在訓練收斂時佔據代表性結構的核心,且對模型性能的聯合消融造成更大影響,顯示早期選擇對最終表徵幾何有決定性作用。
深度分析
本研究提出 Agentic GraphRAG,一套以 Neo4j 知識圖為核心、結合確定性結構匯入與大型語言模型(LLM)抽取的代理式檢索框架,專為商業登記事項而設。系統把驗證過的結構欄位當作強節點,並用 LLM 從公告文本抽出弱節點,再以確定性方法做身份解析與去重。
深度分析
本文以一個可檢視的案例,報告使用 Aristotle API 結合 Lean 4 嘗試形式化 IMO 2009 的 Grasshopper 組合問題。Aristotle 產出一套 Lean 檔案,成功驗證四個局部輔助引理(包含最終和式、相鄰交換的影響與最大化引理),但主定理以未證明的 placeholder(sorry)收尾。
深度分析
面對查詢所需表格數變動性,固定top-k檢索常漏或噪入。ATR採查詢自適閾值、相關性校準與語義群聚損失,並以滑動視窗重排提升大規模語料處理效率,在Spider、BIRD與Spider2.0上顯著抑制多餘表格並提高下游text-to-SQL執行準確度。
深度分析
在招聘、授信與醫療篩檢等應用中,傳統策略分類(Strategic Classification)多假設個體完全理性,但行為經濟學與心理學顯示實際決策常有系統性偏誤。