深度分析 以流水陣列加速 Kuramoto 局部非線性漂移:SA-Kura 架構與能耗評估 擴散模型採樣昂貴,Kuramoto方位擴散以局部相位耦合取代線性漂移,保留更多局部結構並提升步數效率。SA-Kura將sin(θj−θi)重寫為鄰居累加後再與中心相位乘減,移除PE內三角單元並以流水陣列執行。實驗顯示在45nm綜合下,相較SoC軟體延遲與能耗分別降約193×與69.4×,對Jetson Orin Nano則更快6.57×且每像素能耗約46×更低。