深度分析 文本條件擴散模型下的語意比較:以影像分布衡量文本相似度(含 Stable Diffusion 實驗) 為突破文字表述的細微差異,研究以文本在擴散模型中所「召喚」的影像分布作為語意相似度衡量;核心做法是比較兩組文本條件下逆時序擴散 SDE 的 Jensen–Shannon 散度並以蒙地卡羅估算;結果顯示其與大型語言模型的 zero-shot 方法相當,且能產生影像層面的可解釋視覺化。