TANDEM
TANDEM:串聯強化學習與跨模態快取的多模態仇恨言論時序定位框架
隨著社群平台長篇多模態內容增加,視聽文本交織使仇恨言論檢測更複雜。論文提出TANDEM框架,將二元判別改寫為結構化時序推理,透過視語與聲語模型的串聯強化學習(tandem reinforcement learning)與跨模態上下文快取,穩定長序列推理並可進行時序定位與目標識別。
TANDEM
隨著社群平台長篇多模態內容增加,視聽文本交織使仇恨言論檢測更複雜。論文提出TANDEM框架,將二元判別改寫為結構化時序推理,透過視語與聲語模型的串聯強化學習(tandem reinforcement learning)與跨模態上下文快取,穩定長序列推理並可進行時序定位與目標識別。
深度分析
荷蘭警方與國家資安中心合作,查扣並讓一個由約兩百台伺服器管理、超過一千七百萬裝置的殭屍網路下線,主機位於荷蘭。當局與非營利組織指出,該網路疑與提供住宅代理服務的ASOCKS有關;住宅代理會透過第三方裝置轉發流量,使來源看似「正常」但也便於躲避地理限制與偽裝攻擊行為。
速報
企業在監控系統時產生大量可觀測性時間序列資料。論文提出TelecomTS,來自5G電信網路,包含去匿名化共變量與絕對量級資訊。並提供異常檢測、根因分析與多模態問答等下游任務。測試顯示現有基礎模型面對突發噪聲與高變異時效力有限,保留量級資訊至關重要。
深度分析
面對真實世界的突發挑戰,機器人需要超越單純動作執行的推理能力。RoboWits以多代理自動生成流程構築雙臂推理任務,提供種子任務、變異、場景與評分標準,並以模擬實驗衡量預訓練VLA與模組化規劃器的表現。結果顯示預訓練模型在受變異影響的場景仍然脆弱,突顯推理與策略適應的研發空白。
速報
研究人員公開可讓未受信任使用者取得Linux系統root權限的攻擊程式碼。本次事件相關Ubuntu與Canonical網站遭受由Beam等壓力測試工具衍生的DDoS攻擊,導致多數官網與更新主機失聯。受影響服務包括下載與安全公告通路,使用者轉向鏡像站繼續取得更新。該攻擊同時干擾廠商正常通報與回應流程。調查仍在進行中。
速報
研究對分子訊息傳遞神經網路做操作子層級的因子基準,拆為訊息初始化、節點-邊融合與節點更新三類,測試84種配置與十個MoleculeNet資料集。結果顯示性能差異主要源於訊息構建,串接混合在回歸任務具優勢,代表性設定也在多數基準取得競爭成績。
速報
研究發現LoRA適配器可透過訓練資料中毒植入後門,維持原本任務表現。攻擊以特定觸發詞為錨,泛化屬於詞元層級而非結構化引文。作者提出兩條檢測途徑:一是基於probe電池的行為統計量化異常,二是權重層級的標準差指標,兩者對供應鏈掃描具實務應用價值。
速報
研究發現主動代理把使用者活動序列轉為文字逐一詢問大型語言模型成本高。文中改以時序圖更新,提出Temporal-Graph-Learning(TGL)編碼器,對每事件預測觸發機率與實體路由,僅在觸發時才呼叫LLM;在14個基線平均F1提升16.7且延遲與記憶體可在裝置部署。
速報
面對雲端大型語言模型與可離線部署的小型模型的取捨,研究把混合式多代理系統當作中間解。論文將兩種代表性系統改為支援雲端與裝置協作,分析成本、耗能與效能的權衡,發現小型模型可從大型模型協助中獲利,但最佳架構高度依賴任務,更多算力未必帶來更好結果。這為邊緣與雲端協同的設計提供實證洞見。
速報
本研究對大型語言模型(LLM)發起的大規模自動滲透測試進行實證分析:在相同蜜罐環境(包含 OWASP Juice Shop 與兩個其他易受攻擊服務)上,對 4 款模型各執行 100 次、共 400 次試驗。實驗固定提示、協調器與目標,衡量模型在重複試驗下的攻擊一致性、失敗模式與首次成功時間。
深度分析
本研究指出大型音訊語言模型的越獄風險從文字擴展到語音感知流程,涉及語義、聲學、訊號與嵌入層攻擊。作者提出統一分類並在十個開源模型受控評測,發現NarrativeFraming為低延遲語義威脅,AcousticBest-of-N揭示音訊空間最壞情況脆弱性,並強調防禦需在攻擊成功率、誤拒率與延遲間權衡。
深度分析
研究指出大型語言模型規劃時常因單一非法動作導致整條路徑失效。RePoT引入可回復執行:先以PoT產生程式並驗證可行前綴,再以單次LLM呼叫修補後段,顯著提高多模型規劃成功率與回復能力。在PuzzleZoo等基準上,RePoT在強化模型配置下展現雙位數點數提升,並證明檢查點資訊是關鍵復原信號。