潛在 think 令牌 - Agents Report

深度分析

TTE-Flash：以潛在 think 令牌在單一 LLM 中加速多模態推理感知表徵

TTE-Flash 提出以潛在（latent）think 令牌取代顯式 Chain-of-Thought（CoT）軌跡，使多模態通用表徵在推理感知下保持高品質，且推理延遲維持恆定。作者採用統一 LLM Backbone，設計 think 與 embed 兩類令牌，並比較 looped 與 register 兩種萃取架構；