深度分析 IndoBias:首個印尼多語言文化偏見基準揭示大型語言模型族群偏見 印尼擁有超過1300個族群與700種語言,但大型語言模型的偏見研究仍缺口。研究團隊推出IndoBias,以印尼語、爪哇語、巽他語與馬卡薩語建立深度與廣度雙軌評測。結果顯示解碼模型在印尼語上偏向刻板敘述,而在意識形態與宗教領域本土語言偏見更高,且Common Crawl資料比人審文章更易植入偏見。