深度分析
SANA-Streaming:Hybrid Diffusion Transformer 實現即時高畫質串流影片編輯
即時串流影片編輯需求日增,SANA-Streaming 以混合擴散變換器結合 GDN 線性注意力與軟最大注意力,搭配循環反向正則化與混合精度量化,實現在 RTX 5090 上 1280×704 解析度、24 FPS 的即時編輯表現。同時保持長距離時間一致性,較現有方法提升多項指標。
深度分析
即時串流影片編輯需求日增,SANA-Streaming 以混合擴散變換器結合 GDN 線性注意力與軟最大注意力,搭配循環反向正則化與混合精度量化,實現在 RTX 5090 上 1280×704 解析度、24 FPS 的即時編輯表現。同時保持長距離時間一致性,較現有方法提升多項指標。
3D Gaussian Splatting
3DGaussianSplatting佔用大量儲存空間,研究提出GETA-3DGS以自動化聯合結構剪枝與混合精度量化,並引入渲染感知重要度與屬性分層量化策略。實驗於多項資料集顯示可約五倍壓縮且維持高品質。論文指出位元寬度分配為主導因子,異質化配置優於統一6位上限。
深度分析
隨著大型語言模型向邊緣裝置擴散,計算與記憶體受限成為瓶頸。研究者提出以 KL 散度為基礎的前向感度分析,快速找出混合式 SSM‑Transformer 中最易受量化影響的元件。實驗顯示,KL‑導向的混合精度配置在 Intel Luna Lake 上可達接近 FP16 的困惑度,同時維持與統一 INT4 相當的模型大小與吞吐量。