深度分析 TTE-Flash:以潛在 think 令牌在單一 LLM 中加速多模態推理感知表徵 TTE-Flash 提出以潛在(latent)think 令牌取代顯式 Chain-of-Thought(CoT)軌跡,使多模態通用表徵在推理感知下保持高品質,且推理延遲維持恆定。作者採用統一 LLM Backbone,設計 think 與 embed 兩類令牌,並比較 looped 與 register 兩種萃取架構;