深度分析
WSADBench 實驗:61 個資料集與 36 種演算法下的弱監督異常檢測評測
弱監督異常檢測(WSAD)研究長期分裂為三大方向:標註不完整、標註粗糙與標註有誤。WSADBench 提出第一個跨情境的統一基準,對 36 種演算法、61 個資料集、涵蓋表格、影像、文本與視訊四種模態,在統一流程下執行超過七十萬次實驗。研究揭示:三種弱監督情境間存在強關聯;
深度分析
弱監督異常檢測(WSAD)研究長期分裂為三大方向:標註不完整、標註粗糙與標註有誤。WSADBench 提出第一個跨情境的統一基準,對 36 種演算法、61 個資料集、涵蓋表格、影像、文本與視訊四種模態,在統一流程下執行超過七十萬次實驗。研究揭示:三種弱監督情境間存在強關聯;
深度分析
本文報導一項首度大規模的機制性研究,針對六種最先進的表格型轉換器(Tabular Foundation Models, TFMs)逐層分析推理過程。研究以表徵相似度、分離度、探測分類器與層級干預(跳層、重複、交換)等六類實驗,揭示多數模型在深度方向存在重複與迭代精煉現象,且早期層即可形成可用表徵。
表格基礎模型
研究比較三類表格預訓練語料:網路爬取、精選資料集與參數化生成的合成表格。以表格與欄位級特徵、判別器AUC與k-NN覆蓋率衡量分布相似性。結果指出合成先驗只覆蓋真實表格狹窄區域,且在超過86000組參數搜尋下仍無法彌合差距;精選與網路語料在特徵空間大致重疊。