XGBoost - Agents Report | 代理人報告

深度分析

以 UI 行為軌跡對 LLM 代理進行指紋化：基於 XGBoost 的模型歸屬研究

研究指出，當LLM代理在網頁上瀏覽時，其UI行為可揭露背後模型身分。團隊以被動JavaScript收集點擊、滾動與交互時序，並用分類器分析行為特徵與時間統計。結果在十四款前沿模型上最高達96%F1，代表被動觀察即可支援針對性攻擊風險。並示範少量樣本即可恢復辨識能力。

LLM代理

低延遲詐欺偵測層：在LLM代理以XGBoost與互動軌跡辨識對抗攻擊

大型語言模型（LLM）驅動的代理雖強化自動化與工具整合，但也擴大攻擊面。本研究提出一個低延遲的「詐欺偵測層」，不再僅判斷單一提示是否惡意，而是以互動軌跡為單位，整合提示特徵、會話動態、工具使用、執行上下文與詐欺靈感信號等結構化執行時資料。該偵測層置於代理在執行敏感動作前，採用輕量模型以達成實時性；

XGBoost

從訓練資料到後處理：XGBoost 與百分位分級如何影響早期預警系統公平性

與公立學院合作複製並稽核部署中的早期預警系統。使用機構訓練資料、XGBoost模型與百分位後處理，檢視性別、年齡與居留差異。結果發現年輕、男性與國際學生被過度標記，後處理放大了這些差距。並在資源分配上造成不均。研究指出流水線中每個階段都可能產生並放大不公平。

Verilog

VeriCWEty：以向量嵌入與 LLM 驅動的 Verilog 行級 CWE 偵測

硬體設計的安全檢測面臨規模與語意辨識的雙重挑戰。VeriCWEty 採用針對 Verilog 微調的解碼器型大型語言模型（LLM）所產生的向量嵌入，將 CWE（Common Weakness Enumeration）以向量形式編碼，結合投票式自動標註與梯度提升分類器，在模組層與行級同時進行弱點偵測與定位。