深度分析
Falcon Perception 與 Falcon OCR:早期融合單一骨幹在開放詞彙分割與文件理解的實作與效能
FalconPerception由TII提出,採早期融合將影像切片與提示同序列處理,混合注意力保留雙向視覺上下文與自回歸文字解碼;Chain‑of‑Perception將實例拆為座標→大小→分割,實現可變長度密集輸出;在開放詞彙分割基準SA‑Co上獲得68.0 Macro‑F1,並伴隨專為文件理解的Falcon OCR(0.3B)在olmOCR與OmniDocBench取得高分。