深度分析
LLM 驅動社交代理在新聞回覆中的仇恨言論與語意對齊實證評估
本研究檢視大型語言模型(LLM)生成的短回覆能否重現真實受眾對新聞的可量化特性。研究以 Hatemedia 基準為基礎,將5,631則新聞與58,555則真實回覆作為刺激,使用五款開源 LLM(包含 Mistral7B、Mistral24B、Llama8B、Qwen3、GPT-OSS)在兩種生成條件(原始模型與微調)下產生配對合成回覆。
深度分析
本研究檢視大型語言模型(LLM)生成的短回覆能否重現真實受眾對新聞的可量化特性。研究以 Hatemedia 基準為基礎,將5,631則新聞與58,555則真實回覆作為刺激,使用五款開源 LLM(包含 Mistral7B、Mistral24B、Llama8B、Qwen3、GPT-OSS)在兩種生成條件(原始模型與微調)下產生配對合成回覆。
深度分析
開放權重與私人人工智慧興起,使語言模型成為私有資產。文章建議撤回「positive backdoor」稱呼,改以「秘密對齊」來中性描述由觸發器啟動的隱藏行為;並主張在未通過六項嚴格標準化評估前,不應將此類機制視為安全防護,因其對保密性、完整性與可用性構成實務風險。
深度分析
本研究掃描近四千個代理人技能市集樣本,揭示技能包中存在大規模惡意載荷與脆弱面。作者以多重行為準則與模型輔助掃描器檢測提示注入、惡意程式碼、遠端下載與祕密外洩等威脅,並統計關鍵等級風險。結果顯示高危險技能普遍存在,呼籲市集與開發者採用自動化分析與上架門檻以降低攻擊面。
速報
大型語言模型在Oracle到PostgreSQL遷移面臨高token成本、長上下文衰退與語義漂移等挑戰。論文把token優化視為受限轉換問題,提出十二種策略並在多項指標上衡量,發現自適應路由在減少tokens與保留語意間取得實務折衷,而過度schema蒸餾雖提升效率卻嚴重損及語意。
速報
背景:大型語言模型成為軟體開發基礎。方法:提出垂直整合偏誤(VIB),以VIBench在20種整合情境評估供應商關聯模型對直接與代理式代碼生成的生態傾向。結果:關聯模型在直接生成上最高多出18.8個百分點,代理式工作流程放大至39.2個百分點。
深度分析
本研究指出法律判決預測僅見已起訴案件,留下證據不足與不罰等盲區。提出檢察決定預測(PDP),以四分類補全責任評估並建立PDP‑Bench(4,630件)。實驗發現主流大型語言模型在PDP上表現顯著下降,常規強化路徑無法完全改善,顯示需新的推理與回饋機制。
深度分析
研究者發表名為YellowKey的概念驗證,示範在具體實體存取情境下以特製FsTx目錄和交易式NTFS回放,繞過Windows11預設TPM-only BitLocker保護於WinRE時取得完整磁碟存取權,凸顯TPM-only配置於實體攻擊下的風險。
深度分析
為即時 AR/VR 與機器人應用,系統需在裝置端邊學習新的人類動作且不遺忘既有類別。CLANE 在 Intel Loihi 2 上結合事件相機、脈衝卷積網路與擴展 CLP-SNN,並以時間聚合與定點正規化處理動作片段。整合式部署在晶片上完成推論與在線增量學習。於 THU E‑ACT‑50 評估顯示,在僅小幅準確度下降下,實現顯著能耗與延遲改善。
速報
面對需滿足語言或格式正確性的生成任務,研究提出prefixfilters作為每領域與模型的符號化前綴過濾器,並用Palla算法學習這些模式,結果能量化LLM錯誤並在TypeScript生成上使Qwen2.5-1.5B的編譯成功率更顯著提升。
深度分析
研究檢視大型語言模型在學者推薦的「人格提示」效應。作者系統化變動提問中的請求者身分與內容,在六個學科與四十三種模型上比對技術品質與社會代表性。結果顯示模型本身決定回應有效性,而請求內容如名單長度與領域影響事實性;地理位置這類人格提示則顯著改變被推薦者的族群構成,進一步影響學術可見性與資源分配。
BenGER
研究針對德國法的從屬式法律推理提出BenGER基準,收錄596道試題與531個短答題。採用LLM-as-a-Judge與三位盲審交叉驗證,評估12款大型語言模型,結果顯示封閉旗艦模型領先,而人機共創優於單靠人力。此外文章探討評分可靠性與系統差異。
深度分析
在遙測資料日益多元的背景下,研究提出FLORO以多模態、可用性感知與地理位置編碼學習可轉移表徵。模型在中高解析度衛星、航空與無人機資料上展現穩定遷移能力,凸顯小而多樣化語料也能取得實務化成效。在PANGAEA上分割表現接近更大型模型,並示範地理位置編碼能改善分類。