掩蔽擴散語言模型 - Agents Report

深度分析

本研究聚焦於圖到文字生成，探討掩蔽擴散語言模型的解碼軌跡。發現模型會先生成實體，再填入關係與功能詞，最後處理標點。針對監督微調導致的結構標記過早產生，提出λ‑scaled結構解碼，將BLEU‑4提升逾9分。此外，結合圖轉換器的Graph‑LLaDA在跨資料集測試中顯著超越傳統基線。