速報
KOTOX:針對韓語混淆有害語句的去混淆與去毒化資料集
針對語言模型在網路環境遭遇刻意文字混淆的挑戰,研究團隊提出KOTOX,一個韓語去混淆與去毒化資料集。研究以語言學為基礎,分類韓語的黏著型詞形變化與Hangeul特有的正字變體,並從真實範例萃取轉換規則,生成有害與中性句對及其混淆版本。
速報
針對語言模型在網路環境遭遇刻意文字混淆的挑戰,研究團隊提出KOTOX,一個韓語去混淆與去毒化資料集。研究以語言學為基礎,分類韓語的黏著型詞形變化與Hangeul特有的正字變體,並從真實範例萃取轉換規則,生成有害與中性句對及其混淆版本。
深度分析
面對以每代幣計費的雲端LLM服務,供應商可透過誤報分詞增加收益。研究提出揭露產生過程與按字元計費兩種對策,實驗顯示在透明化下仍存在可被利用的啟發式攻擊並能造成顯著加價,因而主張改為按字元線性定價以消除策略動機。並分析其對AI產業、開發者生態與商業模式的長期影響。
深度分析
研究探討AI能否靠自我迭代發現新知。論文提出NOVA框架,把生成-驗證-累積-重訓視為知識空間的適應性抽樣,分析覆蓋條件與失敗模式,並推導在Zipf尾部假設下發現成本隨前沿推進呈多項式放緩。指出驗證不完美會引發汙染陷阱,且人類專家在探索邊界時具備放大量能的角色。
深度分析
在可解釋機器學習領域,研究提出一種基礎模型用以零樣本歸納邏輯規則。方法透過純統計性字面量編碼、平行槽位解碼與可微分T-範數執行,以合成布林公式預訓練。實驗顯示模型可於無重訓下對實務表格任務產生可解釋的DNF規則,展現符號推理基礎模型的可行性。研究也評估了雜訊與虛假相關性下的魯棒性。
Sana
企業導入代理人式人工智慧時真正卡關的不在模型,而在權限與治理。Workday 以 Sana 把系統紀錄當作代理人治理層,並在 Gemini Enterprise 上整合對話介面與驗證流程;核心做法是讓認證、授權與稽核留在原系統,以降低 HR 與財務流程錯誤與合規風險。
TANDEM
隨著社群平台長篇多模態內容增加,視聽文本交織使仇恨言論檢測更複雜。論文提出TANDEM框架,將二元判別改寫為結構化時序推理,透過視語與聲語模型的串聯強化學習(tandem reinforcement learning)與跨模態上下文快取,穩定長序列推理並可進行時序定位與目標識別。
深度分析
荷蘭警方與國家資安中心合作,查扣並讓一個由約兩百台伺服器管理、超過一千七百萬裝置的殭屍網路下線,主機位於荷蘭。當局與非營利組織指出,該網路疑與提供住宅代理服務的ASOCKS有關;住宅代理會透過第三方裝置轉發流量,使來源看似「正常」但也便於躲避地理限制與偽裝攻擊行為。
速報
企業在監控系統時產生大量可觀測性時間序列資料。論文提出TelecomTS,來自5G電信網路,包含去匿名化共變量與絕對量級資訊。並提供異常檢測、根因分析與多模態問答等下游任務。測試顯示現有基礎模型面對突發噪聲與高變異時效力有限,保留量級資訊至關重要。
深度分析
面對真實世界的突發挑戰,機器人需要超越單純動作執行的推理能力。RoboWits以多代理自動生成流程構築雙臂推理任務,提供種子任務、變異、場景與評分標準,並以模擬實驗衡量預訓練VLA與模組化規劃器的表現。結果顯示預訓練模型在受變異影響的場景仍然脆弱,突顯推理與策略適應的研發空白。
速報
研究人員公開可讓未受信任使用者取得Linux系統root權限的攻擊程式碼。本次事件相關Ubuntu與Canonical網站遭受由Beam等壓力測試工具衍生的DDoS攻擊,導致多數官網與更新主機失聯。受影響服務包括下載與安全公告通路,使用者轉向鏡像站繼續取得更新。該攻擊同時干擾廠商正常通報與回應流程。調查仍在進行中。
速報
研究對分子訊息傳遞神經網路做操作子層級的因子基準,拆為訊息初始化、節點-邊融合與節點更新三類,測試84種配置與十個MoleculeNet資料集。結果顯示性能差異主要源於訊息構建,串接混合在回歸任務具優勢,代表性設定也在多數基準取得競爭成績。
速報
研究發現LoRA適配器可透過訓練資料中毒植入後門,維持原本任務表現。攻擊以特定觸發詞為錨,泛化屬於詞元層級而非結構化引文。作者提出兩條檢測途徑:一是基於probe電池的行為統計量化異常,二是權重層級的標準差指標,兩者對供應鏈掃描具實務應用價值。