深度分析
表示移植(representation transplant):以推理—演繹糾纏處理領域泛化
領域泛化(Domain Generalization)常因來源與目標資料分布不同而失效。
深度分析
領域泛化(Domain Generalization)常因來源與目標資料分布不同而失效。
深度分析
本研究回應稀疏優化的穩定性難題,提出ReWA:以重參數化、權重衰減與座標自適應學習率改寫優化步驟。ReWA於數學上連結ℓp正則化(0<p<1),但在參數空間創造較平滑且有界梯度景觀,減少接近零時的震盪;實驗於CIFAR-10與ImageNet顯示在不顯著降準確度下,改善模型稀疏性。
深度分析
對齊結構化資料是電腦視覺與機器學習的核心問題,但傳統方法依賴確定性相似度,易受異質性與噪聲影響。本文改寫自 ArXiv 提案,提出不確定度導向的對齊框架 uDTW(uncertainty-DTW):以每對對應關係建立常態分布,並透過最大概似目標整合精度加權匹配項與對數變異數正則化,抑制不可靠特徵並避免退化解。
深度分析
研究背景:只觀察時間邊際分佈、無軌跡資料時,梯度勢場會導致難學的震盪解。本文以連續性方程弱形式並利用規格自由度,提出非梯度推斷流(NGIF)來參數化一般向量場,並用旋度或散度正則化選擇場結構。實驗顯示非梯度方法在分佈擬合與流場規則性上優於梯度限制基線。
深度分析
本文把自回歸語言模型的鍵值(KV)快取壓縮,形式化為以下一步查詢作為解碼端側資訊的逐序Wyner–Ziv來源編碼問題。作者在多個公開模型與語料上測量到:模型對上下文截斷的敏感性並非指數衰減,而呈現多項式(power-law)衰減;
速報
研究提出 Intent Signal Theory(IST),把用戶的潛在來源意圖視為 AI 互動中缺失的一層。IST 將四個常被混淆的對象明確分為潛在意圖 I*、可觀察意圖代理 Ĩ、載體 P 與模型輸出 O,並形式化維度權重、編碼遮罩與結構/忠實度回收分數。
Constitutional AI
教宗在梵蒂岡發表首份聚焦人工智慧的通諭,並邀請Anthropic代表出席說明,形成教會與矽谷前所未見的對話。Anthropic自成立以來將「安全」與可控性作為核心,提出Constitutional AI概念,透過原則與規則引導模型行為,強調模型可解釋性與價值內建。
Soft Actor-Critic (SAC)
在大規模並行模擬背景下,研究比較了PPO與SAC的差距,指出SAC在初期探索、截斷回報處理與獎勵傳播上存在三大問題;透過策略初始化校正、截斷敏感的評論目標與多步回傳估計等修正,實驗在多款腿型機器人任務上顯示SAC可彌補與PPO的性能差距並在部分任務超越。
深度分析
現代語言模型在網路服務中廣泛應用卻仍易受對抗攻擊。SEP-Attack以DPP取樣產生多樣化替代模型權重,再用加權信心估算字詞重要性以生成候選替換,最後以轉移性得分篩選有效對抗樣本。實驗於四資料集及兩雲端API展現優於既有方法的攻擊能力與效率。
深度分析
這篇研究將語言模型的「操控」(steering)重新框為黎曼幾何上的測地線問題,提出以幾何感知生成自編碼器(GAGA)學習一個輸出空間 Hellinger 距離的拉回度量,作為在激活空間上計算路徑的代理。
深度分析
多模態檢索常用單一向量(single-vector)做全域比對,但會壓縮掉局部證據,影響細節敏感任務的準確度。
深度分析
臨床SOAP筆記自動化評估對具推理能力的大型語言模型進行來源感知測試,交叉比較推理模式與同源檢索(RAG)對產出影響。實驗涵蓋三個資料集、七項自動指標與兩位LLM評審,發現開啟原生推理並不穩定提升品質,反而在多數情況降低表現;同源RAG則帶來有限且具模型依賴性的改善。