深度分析
commit-open:以 SAE 特徵與 Merkle 承諾封堵託管 LLM 的替代攻擊
託管LLM常被以低成本模型替代;論文提出以Merkle承諾的commit-open協議,事先提交SAE每位置信息,再隨機開放抽檢並以joint-z分數判定,能辨識跨家族與LoRA自適應替代,且在測試中對多數攻擊者均生效。承諾開放可閉合SVIP的平行提供漏洞,額外開銷小於特定批次延時上限。
深度分析
託管LLM常被以低成本模型替代;論文提出以Merkle承諾的commit-open協議,事先提交SAE每位置信息,再隨機開放抽檢並以joint-z分數判定,能辨識跨家族與LoRA自適應替代,且在測試中對多數攻擊者均生效。承諾開放可閉合SVIP的平行提供漏洞,額外開銷小於特定批次延時上限。
深度分析
本文從代幣層級的歸因問題切入,檢視以可驗證報酬訓練(RLVR)時序列級獎勵如何被錯置到不重要的代幣,提出結合報酬極性與代幣熵的「四象限分解」診斷工具。作者用條件互信息形式化代幣與結果獎勵的依賴,證明代幣能承載的學習訊號上界受其熵限制;
深度分析
面對層級表頭、合併儲存格等複雜表格格式,ASTRA提出一套訓練-free的語意樹重構與雙模推理流程,以改善大型語言模型在表格序列化與數值推理上的盲點。系統由AdaSTR負責以LLM全域語意重建「邏輯語意樹」,保留顯性階層與隱性語義關係;DuTR則在該結構上執行雙模推理,結合基於樹的文本搜尋與符號化程式執行以做精準驗證。
深度分析
影像審查常以不透明標籤結論,SenBen 提出針對敏感內容的場景圖基準,使用電影影格與 Visual Genome 式標註,並以前沿 VLM 生成偽標籤再蒸餾成精簡模型;採用詞彙感知召回損失與解耦標籤頭改善生成失衡,實現空間定位的可解釋審查並提升本地推論效能。
深度分析
研究以不尋常動作影像為切入,檢視視覺語言模型在事件語意理解的盲點。研究採用VerbNet篩選動詞、以語言模型生成誤導性文本並用文字生成影像合成資料集。實驗比較多種VLM與對比學習模型,結果顯示現有模型難以區分語法正確與語意正確,表現明顯低於人類。
深度分析
在流行病學證據爆發式成長的背景下,如何從研究文章推導出可靠的族群級推論,是公共衛生決策的關鍵難題。EpiQAL 提出首個針對流行病學問答的診斷性基準,包含三個子集——文本事實回溯、多步推理、以及在隱蔽討論段落下的結論重建。構建流程結合專家分類法、多模型驗證與難度篩檢,並允許多答案、多空集合的評分。
深度分析
研究揭露Chromium的Browser Fetch背景下載接口存在未修漏洞,公開了可利用程式碼。攻擊透過啟用持久service worker在背景維持連線,充當代理並監控或發動DDoS。結果是大量Chromium瀏覽器裝置可能被整合成受控網路。
深度分析
MiniMax發表深度技術報告,回顧M2系列(含M2、M2.5、M2.7)在稀疏Mixture-of-Experts、Grouped Query Attention(GQA)與工程化路徑上的關鍵取捨;
深度分析
擴散模型的 Classifier‑Free Guidance 有訓練與抽樣不一致問題。CFG‑EC 主動校正無條件噪聲,透過正交化消除誤差內積干擾,收窄抽樣誤差上界,實驗於 MSCOCO 與 Stable Diffusion 系列展現 FID 與 CLIP 的整體提升。
深度分析
為了在大規模網路語料中發現對機器翻譯模型真正具挑戰性的測試例,研究將「主題」抽象成多臂賭場中的「臂」,並以有限計算預算反覆抽樣、翻譯與品質估計來量化每個主題的難度。
深度分析
研究背景:RLVR 用程式化可驗證信號提升大型語言模型於數學與程式任務的表現。方法:文章檢視預算匹配、偏提示污染與評分穩定性,並提出分項獎勵與稅意識訓練協議,包含校準拒答與審核溯源。主要影響:在嚴格對照下,若干號稱的推理增益會收斂或消失,建議以更健全的評估與報告標準保留實用收益同時降低風險。
深度分析
研究比較W8A8-FP、W8A8-INT與W4A16-INT三種量化格式在學術與實務基準的準確度與推論效能;採用自動化評測、文本相似度分析與vLLM在多款GPU的延遲量測;結果發現W8A8-FP近乎無損,W8A8-INT衰減輕微,W4A16在同步部署成本效益最佳。