類別知覺 - Agents Report

速報

研究指出，大型語言模型在處理阿拉伯數字時，隱藏層表徵在位數邊界產生類別知覺。以代表性相似性分析比較多款架構，發現「對數距離＋邊界增強」模型能更好擬合，且效應專屬於位數轉換的tokenisation不連續，顯示輸入格式結構可塑造模型表徵的類別化幾何。