深度分析 UniRect‑CoT:利用自我校正提升統一多模態模型生成品質的免費午餐 統一多模態模型在理解上表現強勁,但生成能力不足。研究提出 UniRect‑CoT,透過反思式鏈式思考讓模型在擴散去噪時自我校正,激活內在知識。實驗顯示,套用此框架後,可顯著提升多任務生成品質,為多模態 AI 的成本與效能帶來新突破。
深度分析 資訊熵探測揭示統一多模態模型的偽統合與訊息分歧 統一多模態模型本應結合語言推理與影像生成,卻常出現偽統合現象。研究以熵探測框架同時分析編碼與產出,發現模態不對稱與回應模式分裂是主要原因。唯有雙向統一的模型才能提升推理式文字到影像的效能。