深度分析 cuRegOT:在 CUDA 上實作稀疏+低秩準牛頓法以加速 entropic-regularized 最佳運輸 最佳運輸(OT)在大規模問題仍受計算瓶頸限制。cuRegOT將稀疏+低秩準牛頓法移植至 CUDA,透過攤平符號分析重用、CPU/GPU非同步重疊以及合併梯度的高效 CUDA kernel,縮短求解時間。實驗在多項基準上展示相較既有 GPU 解法顯著加速。