速報 Early Noise Dropping(END):在大型語言模型中及早剔除噪訊提升效能 大型語言模型在處理長短不同的輸入時,常被無關或噪訊片段干擾,導致輸出品質下滑。研究提出Early Noise Dropping(END),不需微調模型,將輸入切分為多個片段,並在模型的早期層使用線性探測器判別哪些片段具資訊價值。END會在推理過程中及早丟棄被判定為噪訊的片段,以保留重要內容、減少注意力分散並降低計算量。