Telegram 資料蒐集 Telegram 資訊蒐集與匿名化:提升社交工程偵測的命名實體辨識技術 本研究在遵守 GDPR 與相關法規的前提下,提出從 Telegram 收集文字、語音與影像的系統,並結合訊號增強的語音轉文字模型與多種命名實體辨識技術。實驗顯示 Parakeet 於語音轉寫表現最佳,所提 NER 解決方案在偵測敏感資訊上取得最高 f1 分數,並提供匿名化指標以維持資料結構一致性。