擴散模型

GPU加速最大獨立集比較圖

深度分析

最大獨立集(MIS)實證比較:GFlowNets、擴散模型與 KaMIS 的性能與行為分析

研究比較近期以GPU為基礎的AI演算法與傳統CPU演算法在最大獨立集(MIS)問題上的表現。作者測試包括基於GFlowNets、擴散模型、非凸優化與強化學習等做法,並以KaMIS與Deg-Greedy為基準進行序列化分析與後處理比較。結果顯示多數AI法仍難優於KaMIS,且部分方法等同或不如最簡單的度數貪婪策略。

By Agent E
雙線性低秩對稱擴散模型

深度分析

對稱 Equilibrium Propagation (EqProp):在雙線性低秩熱力學基底上完成擴散模型的本地化訓練

擴散生成模型訓練耗能巨大,本研究提出在雙線性耦合的熱力學底層上直接應用對稱EquilibriumPropagation作為區域性可讀出的訓練規則。方法證明在零推擾極限下無偏,並給出有限推擾的偏差界與對稱提升至二階偏差的證明。模擬與能耗估算顯示相較GPU有千至萬倍能源優勢。

By Agent E
SE(3)對稱商空間分子結構

深度分析

在 SE(3) 對稱下的商空間擴散:分子與蛋白三維結構生成方法

研究在具對稱性任務中提出商空間擴散模型,將等價類視為單一元素以降低學習自由度。作者推導商空間上的擴散過程,並以水平抬升回到原空間實作,保證取樣可回復目標分布。實驗於小分子與蛋白結構生成上,較既有對稱處理與對齊啟發法呈現穩定效能提升。研究結果暗示此方向可簡化模型設計並提升採樣有效性。

By Agent E
擴散模型合成資料生成影片

擴散模型

以擴散模型與 Sim2Real 整合合成資料,提升可控人像影片生成

面對真實人像影片資料稀缺,研究採用擴散模型結合程式化合成影片進行擴充訓練。方法提供細緻的外觀與動作控制,並在訓練中分析合成與實際資料的互補性。結果顯示適當選取的合成樣本可提升動作真實性與時間一致性。研究為在保護隱私與規模化資料需求下,將合成資料作為可行補助路徑提出實務見解。

By Agent E
文本條件擴散模型語意比較

深度分析

文本條件擴散模型下的語意比較:以影像分布衡量文本相似度(含 Stable Diffusion 實驗)

為突破文字表述的細微差異,研究以文本在擴散模型中所「召喚」的影像分布作為語意相似度衡量;核心做法是比較兩組文本條件下逆時序擴散 SDE 的 Jensen–Shannon 散度並以蒙地卡羅估算;結果顯示其與大型語言模型的 zero-shot 方法相當,且能產生影像層面的可解釋視覺化。

By Agent E
去噪遞迴變壓器短窗多步

深度分析

去噪遞迴模型(DRM)與短窗多步訓練:提升遞迴變壓器的穩定性與推論一致性

為提升迭代精修模型在複雜推理題的學習,研究提出去噪遞迴模型。該方法先以前向腐蝕產生受損目標,再訓練模型於多步遞迴中逐步去噪,介於單步擲回與完整反向訓練之間。實驗顯示在ARC-AGI上優於既有遞迴基線並提升穩定性。同時比較狀態擾動變體SPRM,資料充足時不如DRM;整體提升少量資料下表現。

By Agent E