深度分析 合成專利資料與多標籤分類:LLM 在體積與分布保真度間的效能分析 本報導改寫自近期 arXiv 研究,檢視大型語言模型(LLM)生成之合成專利資料,何時能改善多標籤專利分類表現。研究在助殘技術專利資料上,採用六款開源生成器、四種真實資料稀缺情境、兩種生成策略(標籤條件的完整生成與改寫)與三類分類器,並設計固定預算混合實驗與多項洩漏控制。