深度分析
CEAR:透過 VGA、DTS 與噪聲 logits 強化集合模型的可驗證安全性
對抗性擾動嚴重威脅深度神經網路安全,研究者提出 CEAR 結合可變高斯增強、溫度蒸餾與噪聲 logits 的集合防禦,透過兩種投票機制提升認證精度與半徑,實驗顯示在 MNIST、CIFAR‑10 與 TinyImageNet 上相較基線有更高的認證準確率與抗轉移性並縮減了對抗樣本的傳遞效應。
深度分析
對抗性擾動嚴重威脅深度神經網路安全,研究者提出 CEAR 結合可變高斯增強、溫度蒸餾與噪聲 logits 的集合防禦,透過兩種投票機制提升認證精度與半徑,實驗顯示在 MNIST、CIFAR‑10 與 TinyImageNet 上相較基線有更高的認證準確率與抗轉移性並縮減了對抗樣本的傳遞效應。
深度分析
研究聚焦於高維線性回歸中的知識轉移,透過光譜分析揭示知識蒸餾的光譜視界擴展與弱強泛化的光譜去噪機制,證明轉移效能受隱式正則化與光譜學習速率交互支配,對未來AI模型壓縮與強化學習具重要啟示。此發現亦說明在大模型微調時,教師模型的光譜特性可作為設計新型蒸餾策略的指標。
深度分析
隨著深度模型規模持續擴大,壓縮成為關鍵挑戰。本研究提出以近似前向微分等價為基礎的神經網路聚合方法,透過單一容差參數ε將功能相似的神經元合併,實現高達六成以上的參數削減,同時保持預測精度。實驗在合成動力系統與四個公開回歸基準上驗證,效果優於傳統幅度剪枝與Wanda,顯示此差分等價聚合是可行的替代路徑。
深度分析
研究指出,Windows 作業系統的攻擊面龐大,傳統分析受限於目標選擇成本。作者提出 Symbolicate‑Enrich‑Sample 三階段管線,先自動抓取公開符號檔再以低成本 LLM 標記可達性、風險與漏洞類型,最後以優先抽樣產生多樣化的研究佇列。實驗在 7 百萬函式中篩選至約 2.2 萬針對性目標,顯示該層可大幅縮小分析範圍。
深度分析
隨著細粒度情感分析需求提升,DiffuSent以非自回歸擴散方式將所有ABSA子任務統一為邊界去噪過程,透過高斯噪聲與對比去噪訓練提升多詞三元組抽取精度,在多樣化語料上測試,實驗顯示在七項子任務上平均F1提升2.48點且推理速度最高可達181倍。
深度分析
大型語言模型在程式碼基準上已趨於飽和,導致現有測試集難以區分模型能力。BenchEvolver 以解答為中心,透過結構化變異演化參考程式,從而自動產生更難且可驗證的題目與測試。實驗在 LiveCodeBench 與 SciCode 上證實,演化後的題目顯著降低目標模型的 Pass@1,且即使是產生題目的模型本身也會受挑戰。
深度分析
印尼擁有超過1300個族群與700種語言,但大型語言模型的偏見研究仍缺口。研究團隊推出IndoBias,以印尼語、爪哇語、巽他語與馬卡薩語建立深度與廣度雙軌評測。結果顯示解碼模型在印尼語上偏向刻板敘述,而在意識形態與宗教領域本土語言偏見更高,且Common Crawl資料比人審文章更易植入偏見。
深度分析
研究團隊推出 TECCI 基準,收錄 7 大類 7,550 組全新圖像與指令,涵蓋文字、時鐘、車輛、建築、藝術、動物、自然,指令包括文字更換、時鐘時間、視角與比例等五種編輯類型,且提供 530 筆手寫高難度指令。人類與自動評分測試五大模型,最高成功率僅 22%,顯示編輯挑戰仍待突破。
深度分析
研究指出,多語言大型語言模型在低資源語言的安全拒絕失效,並非缺少有害表示,而是校準門檻偏移。透過少量目標語言範例重新校正高資源門檻,即可大幅提升拒絕率,同時保留指令完成能力。此方法僅需1至4筆範例即可完成校正,顯示低資源安全問題可藉現有表示修正,降低大量語料標註成本。
深度分析
極端多標籤分類(XMC)面臨上百萬標籤的記憶體與運算瓶頸。研究提出 HASTE,採用群組共享固定 fan‑in 稀疏結構,讓語意相近的標籤共用稀疏特徵子集,同時將常見標籤以密集頭部處理,稀疏尾部則維持低記憶體開銷。
深度分析
隨著模型規模不斷膨脹,剪枝成為降低記憶體與運算成本的關鍵技術。研究提出STARFISH方法,利用少量未標記影像校正集,使剪枝後的網路內部表示與原始模型對齊,從而恢復精度。實驗顯示,在75%權重被剪除的情況下,STARFISH只需0.4%訓練影像即可恢復原始模型82%的準確率,遠超其他方法。
深度分析
組合路徑規劃如 TSP、CVRP 受平面對稱影響。MViewRouter 以多視圖交替注意力與集合梯度內化 D4 對稱,讓決策具不變性。實驗證明在標準與實務基準上均達到競爭解品質與零樣本泛化,且較傳統測試時增強更穩定。預期此幾何等變性框架可擴展至 3D 約束路徑與其他車輛調度問題。