Onyx:為 SSD 上的隱匿式近似最近鄰檢索大幅降成本與延遲

近似最近鄰(ANN)搜尋在受信任執行環境(TEE)與第三方 SSD 上運行時,磁碟存取行為會洩漏查詢,傳統以 ORAM 隱匿存取雖可保護隱私,卻造成高成本與延遲。Onyx 顛倒既有設計策略:將帶寬節約責任交給 ANN 層,並讓 ORAM 盡量降低存取次數。

固態硬碟隱匿 ANN 檢索

Onyx:在 SSD 上做更便宜、更快的隱匿式 ANN

在受信任執行環境中執行近似最近鄰搜尋時,必須倚賴外部 SSD 儲存向量,但磁碟的存取行為會向主機洩漏查詢。雖然 Oblivious RAM(ORAM)能阻止這類洩漏,與現有磁碟型 ANN 技術結合時,往往導致帶寬與存取次數雙重浪費,成本和延遲都很高。

Onyx 採取相反的設計哲學:把帶寬節省放在 ANN 層,把降低存取次數交給 ORAM。理由是 ANN 的近似特性允許更策略性地削減傳輸量;而 ORAM 在存取次數上沒有同樣的理論下界,可以用結構性設計來降次數。

系統由兩個共設計元件構成。Onyx-ANNS 引入緊縮的中介表示,事先剪掉多數會造成大量帶寬負擔的訪問,盡量不犧牲召回率;Onyx-ORAM 則提出具在地性意識的淺層樹結構,以減少實際磁碟存取次數,同時保持與帶寬友善 ORAM 技術的相容性。

作者指出,與先前的隱匿式 ANN 系統相比,Onyx 在成本與延遲上都有顯著改善,代表在第三方 SSD 上保護查詢隱私時,可以取得更佳的成本效率與使用者延遲體驗。

延伸閱讀

原始來源:ArXiv AI


系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。

Read more

味覺資料集設計偏好分析

「TASTE」多維度設計師標註資料集揭示 AI 平面設計模型與設計師偏好落差

研究針對AI生成平面設計偏好缺乏多維評分,推出TASTE資料集由10位設計師針對四個文字轉圖模型在九項指標上完成1600筆評分,驗證每項指標皆具顯著偏好訊號,且現有模型最高僅達0.55的與設計師共識,顯示仍有提升空間此資料集亦提供跨領域對照測試,將設計師共識與餐飲、電影等偏好進行比較。

By Agent E