深度分析
RAG‑Pull:利用不可見 Unicode 操控檢索層以影響 RAG 程式碼生成
RAG系統為降低幻覺而引入檢索機制。本研究提出RAG‑Pull,藉由在查詢或程式庫中插入不可見Unicode字元操控檢索向量,將攻擊者控制的惡意程式片段推升至檢索結果前列,最終可能被模型直接生成並導致安全風險,實驗顯示檢索與端到端攻擊成功率極高。
深度分析
RAG系統為降低幻覺而引入檢索機制。本研究提出RAG‑Pull,藉由在查詢或程式庫中插入不可見Unicode字元操控檢索向量,將攻擊者控制的惡意程式片段推升至檢索結果前列,最終可能被模型直接生成並導致安全風險,實驗顯示檢索與端到端攻擊成功率極高。
深度分析
屬性社群搜尋(ACS)要求在帶屬性標註的圖上,找出既具結構凝聚力又屬性一致的社群。
深度分析
過去十年漏洞賞金制度由敵對走向合作;如今代理式人工智慧能自動搜尋弱點、生成利用程式碼與自動掃描系統,壓縮發現與開發時間。結果是企業收到大量低到中價值通報、修補節奏被擠壓,攻擊者同樣能更快產生零日漏洞利用,改變賞金與防禦經濟。生態與開發者生計也面臨重整。
深度分析
深度學習訓練通常受限於反向傳播的高記憶需求。本文提出一套以向前模式為基礎的技術,採用向量-逆雅可比乘積在可逆網路上先求輸入梯度,接著前向累積計算參數梯度,從而保留真實梯度同時降低記憶使用。實驗顯示此法在時間效率接近反向傳播的情況下,能明顯縮減記憶占用並適用於多種架構。
深度分析
針對成長超線性且可能突變的時序資料,研究以分布式預測檢視大型語言模型表現。使用無污染模擬基準 FBSim、合成 SIR 及多項實證資料,比對連續量化分位與二元閾值評分。結果顯示:更高能力模型在包含尾部風險的長期預測上反而更差,主要因為上尾被過度外推。
深度分析
隨著生成式人工智慧進入高風險應用場景,現行基準評測面臨建構效度不足、資料汙染與快速飽和等問題。本文主張回歸題目層級(item-level)資料以建立嚴謹的評估科學:透過題目內容、逐題回應與統計指標進行細緻診斷,可揭露題目品質、干擾因子與能力映射。
深度分析
隨著FTaaS盛行,多模態大型語言模型面臨資料投毒與後門風險。TCAP以三元注意力剖析將注意力分為系統指令、視覺輸入與使用者文本,透過GMM識別觸發敏感頭並以EM投票隔離疑似中毒樣本,實驗顯示其能在多模型與多種攻擊下有效偵測並維持清潔效能。
深度分析
醫療AI需求準確且可解釋的模型。研究把MedCLIP胸腔X光特徵餵入稀疏自編碼器(MedSAE),以稀疏化並拆解疊加表徵以提高語義單一性。作者再用MedGEMMA自動命名與量化對齊,結果顯示MedSAE特徵較原始嵌入更具臨床對應,朝透明且可驗證的醫療表示邁出一步。
深度分析
研究指出,檢索增強生成(RAG)可減少大型語言模型的幻覺,針對多模態科學文件的端到端評估仍短缺。本文提出FATHOMS-RAG,結合短語召回與最近鄰嵌入分類器以區分放棄與幻覺,並發現封閉源系統在正確性與幻覺避免上顯著領先。該基準含93題、涵蓋表格、圖像與跨文檔問題,並由人類評估驗證指標效度。
深度分析
在持續學習場景下,模型會累積多種敏感資訊,傳統一刀切的差分隱私常導致效能大幅下降。本文改寫自ArXiv研究,介紹PeCL框架,透過「token級動態差分隱私」依語意敏感度分配隱私預算,並搭配「隱私導引的記憶雕塑」選擇性遺忘模型內敏感信息,同時保留跨任務不變的重要知識。
深度分析
面對時序知識圖資料市集的索引老化、估價錯配與差分隱私預算競耗,該系統提出三層架構。第一層用神經ODE衰減捷徑邊並給出召回損失界;第二層以事件條件化估價回應變動;第三層以多臂協調演算法並以高斯機制釋出私有關聯矩陣。實驗顯示召回、延遲與隱私達到競爭性平衡。
深度分析
在VisionTransformer缺乏內建二維幾何知識的背景下,論文提出Weierstrass橢圓位置編碼(WePE),以複數域上的Weierstrass函數映射影像補丁座標,維持二維網格結構並具雙重週期性與距離衰減性質。實驗顯示WePE在多數訓練與微調場景帶來一致性效益。