深度分析
在高維表格預測中評估 Markov 邊界:效益、估計限制與替代策略
本文以合成基準SCM3K(3,450項任務、欄位數從40到1000)檢視Markov邊界在表格預測上的實用性。理論上,Markov邊界是最小且充分的特徵集合,限制迴歸器於邊界上能在有限樣本下降低誤差;實驗顯示這種改善在高維稀疏情況下更明顯。
深度分析
本文以合成基準SCM3K(3,450項任務、欄位數從40到1000)檢視Markov邊界在表格預測上的實用性。理論上,Markov邊界是最小且充分的特徵集合,限制迴歸器於邊界上能在有限樣本下降低誤差;實驗顯示這種改善在高維稀疏情況下更明顯。
深度分析
圖形異常檢測(GAD)在金融詐欺與社群治理等場景至關重要,但現有評測多仰賴小型且理想化資料,與生產環境差距甚大。本文提出一套多維度基準,從百萬級節點擴展、極低異常率到節點屬性缺失,利用五個來源圖(含兩個工業級原生資料集)系統性比較九類代表性演算法。