深度分析 SANA-Streaming:Hybrid Diffusion Transformer 實現即時高畫質串流影片編輯 即時串流影片編輯需求日增,SANA-Streaming 以混合擴散變換器結合 GDN 線性注意力與軟最大注意力,搭配循環反向正則化與混合精度量化,實現在 RTX 5090 上 1280×704 解析度、24 FPS 的即時編輯表現。同時保持長距離時間一致性,較現有方法提升多項指標。