對抗篡改與跨語診斷漂移:DenseNet121與大型語言模型揭示臨床人工智慧脆弱性
一項來自 ArXiv 的研究指出,目前臨床人工智慧在受控英文資料外表現脆弱。研究以 DenseNet121(CheXNet 架構)在 COVID-QU-Ex 胸部X光集上微調,並用 Fast Gradient Method 製造肉眼難覺察的擾動,結果診斷準確率從89.3%大幅崩落到62.0%。
研究重點:臨床AI在實務場域出現雙重脆弱性
研究以簡潔數據示警:在非理想條件下,臨床人工智慧的診斷可靠性可能大幅下降。
作者先用 DenseNet121(CheXNet 基礎架構),在 COVID-QU-Ex 胸部X光資料集上微調模型,然後施以 Fast Gradient Method 的微幅擾動。結果顯示,模型準確率從89.3%降到62.0%,而瞭解為人眼幾乎無法察覺的擾動就能造成診斷崩潰。即便嘗試常見防禦手段,如高斯平滑或集成投票,亦未能恢復臨床安全水準。
並行的語言穩定性實驗則檢視大型語言模型在多語境下的診斷一致性。研究把20例 COVID-19 臨床病例,分別以標準英文、奈及利亞 Pidgin 與帶 Yoruba 口音的英文輸入,測試 Llama3.1:8b 與 NatLAS。兩款模型在本地化語變體下準確率明顯下滑,顯示語言差異會引起診斷漂移。
作者綜合以上結果,提出一個量化的失敗範圍,對應尼日利亞初級衛生所的實際部署條件,強調現有模型在對抗性攻擊與語言多樣性面前都未達安全門檻,呼籲優先投入對抗加固與語言包容的臨床AI設計。
影響與建議
此研究提醒臨床派生的人工智慧不可僅在標準英文與乾淨資料上驗證。對於計畫在低資源或語言多樣的地區部署的系統,必須同時評估對抗攻擊韌性與跨語言穩定性,才能降低誤診與安全風險。
延伸閱讀
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。