深度分析 ScrapeGraphAI-100k:支援小模型微調的結構化網頁抽取資料集(93,695 範例) 背景:多數現有資料集規模小且僅文字,缺乏網頁結構語境。核心:ScrapeGraphAI-100k 以真實 opt-in 遙測事件建構,提供含 Markdown、提示、JSON schema 與 LLM 回應的 93,695 範例,並標註結構複雜度與驗證結果。主要結果:在該資料集上微調的小型模型可縮短與大型基準在結構抽取上的差距,具成本與在地部署優勢。