深度分析 FairQE:以多代理與 LLM 在推論期校正翻譯品質估計的性別偏誤 FairQE 提出一個多代理、公平性導向的品質估計(QE)框架,針對機器翻譯評估中常見的性別偏差進行緩解。系統先自動偵測語句中的性別線索,生成性別翻轉候選譯文,再以傳統 QE 模型與大型語言模型(LLM)驅動的偏誤推理並行評分,最後依據估測到的偏誤強度動態聚合分數。