速報 KOTOX:針對韓語混淆有害語句的去混淆與去毒化資料集 針對語言模型在網路環境遭遇刻意文字混淆的挑戰,研究團隊提出KOTOX,一個韓語去混淆與去毒化資料集。研究以語言學為基礎,分類韓語的黏著型詞形變化與Hangeul特有的正字變體,並從真實範例萃取轉換規則,生成有害與中性句對及其混淆版本。