深度分析 在 Apple M3 Ultra 上以 CoreML 加速 SDXS-512:實現 512×512 即時 img2img(22.7 FPS) 研究針對Apple M3 Ultra做十階段系統化優化,評估CoreML轉換、量化、TokenMerging與NeuralEngine等技術。結果發現多數CUDA生態優化在統一記憶體架構上失效,唯有CoreML加上為單步蒸餾設計的SDXS-512能在512×512達成22.7FPS即時img2img。