大型語言模型 (LLM) 國家與領域脈絡下的人工智慧評估偏誤:LLM改寫與AI相似度指標的影響 一項以Dimensions資料庫為基礎的研究發現,量化學術論文中人工智慧(AI)使用時,若採用混合(pooled)基準,容易將既有寫作風格差異誤認為AI痕跡。研究以人類撰寫與由大型語言模型(LLM)改寫的摘要差異建立AI相似度指標,並比較整體混合基準與按國家與領域分組的基準。