早期融合 - Agents Report

深度分析

Falcon Perception 與 Falcon OCR：早期融合單一骨幹在開放詞彙分割與文件理解的實作與效能

FalconPerception由TII提出，採早期融合將影像切片與提示同序列處理，混合注意力保留雙向視覺上下文與自回歸文字解碼；Chain‑of‑Perception將實例拆為座標→大小→分割，實現可變長度密集輸出；在開放詞彙分割基準SA‑Co上獲得68.0 Macro‑F1，並伴隨專為文件理解的Falcon OCR（0.3B）在olmOCR與OmniDocBench取得高分。

早期融合 Transformer 骨幹：Falcon Perception 在開放詞彙分割的架構與效能

Falcon Perception 與 Falcon OCR：早期融合單一骨幹在開放詞彙分割與文件理解的實作與效能