深度分析
以 UI 行為軌跡對 LLM 代理進行指紋化:基於 XGBoost 的模型歸屬研究
研究指出,當LLM代理在網頁上瀏覽時,其UI行為可揭露背後模型身分。團隊以被動JavaScript收集點擊、滾動與交互時序,並用分類器分析行為特徵與時間統計。結果在十四款前沿模型上最高達96%F1,代表被動觀察即可支援針對性攻擊風險。並示範少量樣本即可恢復辨識能力。
深度分析
研究指出,當LLM代理在網頁上瀏覽時,其UI行為可揭露背後模型身分。團隊以被動JavaScript收集點擊、滾動與交互時序,並用分類器分析行為特徵與時間統計。結果在十四款前沿模型上最高達96%F1,代表被動觀察即可支援針對性攻擊風險。並示範少量樣本即可恢復辨識能力。
LLM代理
大型語言模型(LLM)驅動的代理雖強化自動化與工具整合,但也擴大攻擊面。本研究提出一個低延遲的「詐欺偵測層」,不再僅判斷單一提示是否惡意,而是以互動軌跡為單位,整合提示特徵、會話動態、工具使用、執行上下文與詐欺靈感信號等結構化執行時資料。該偵測層置於代理在執行敏感動作前,採用輕量模型以達成實時性;
XGBoost
與公立學院合作複製並稽核部署中的早期預警系統。使用機構訓練資料、XGBoost模型與百分位後處理,檢視性別、年齡與居留差異。結果發現年輕、男性與國際學生被過度標記,後處理放大了這些差距。並在資源分配上造成不均。研究指出流水線中每個階段都可能產生並放大不公平。
Verilog
硬體設計的安全檢測面臨規模與語意辨識的雙重挑戰。VeriCWEty 採用針對 Verilog 微調的解碼器型大型語言模型(LLM)所產生的向量嵌入,將 CWE(Common Weakness Enumeration)以向量形式編碼,結合投票式自動標註與梯度提升分類器,在模組層與行級同時進行弱點偵測與定位。