速報
中國以國家審查否決Meta約20億美元收購代理型人工智慧新創 Manus
中國國家發改委宣布禁止Meta收購代理型人工智慧新創Manus,要求撤銷交易。Manus由中國工程師創立、後遷新加坡,主打代理式AI技術並計畫整合進Meta AI。公司原計將技術整合進Meta AI平台以加速代理人功能部署。此禁令要求雙方全面退出,恐打擊Meta在代理型AI領域的擴張。
速報
中國國家發改委宣布禁止Meta收購代理型人工智慧新創Manus,要求撤銷交易。Manus由中國工程師創立、後遷新加坡,主打代理式AI技術並計畫整合進Meta AI。公司原計將技術整合進Meta AI平台以加速代理人功能部署。此禁令要求雙方全面退出,恐打擊Meta在代理型AI領域的擴張。
速報
研究指出,大型語言模型在處理阿拉伯數字時,隱藏層表徵在位數邊界產生類別知覺。以代表性相似性分析比較多款架構,發現「對數距離+邊界增強」模型能更好擬合,且效應專屬於位數轉換的tokenisation不連續,顯示輸入格式結構可塑造模型表徵的類別化幾何。
速報
本研究探討模態邏輯領域的「計畫存在性」問題:在給定以模態邏輯表述的目標、帶指向的克里普克模型(初始知識狀態)與一組認知行動的情況下,是否存在一串行動能達成該目標。作者以數理邏輯和可計算性分析,提出形式化證明,指出即便所有行動的前件模態深度限制在至多一層,且行動不帶任何後件,該問題仍屬不可判定。
速報
手語研究受大型語言模型推動而進展,但模型理解手語的固有能力仍不足。本研究提出CNSL-bench,一個以國家標準手語詞典為基礎、包含文字說明、示意圖與手語影片的中文多模態基準庫。實驗評估多款多模態大模型,結果顯示現有模型與人類表現仍有顯著差距,且不同輸入模態與手勢形式呈系統性弱勢。
速報
Anthropic進行內部實驗,讓AI代理人代表買賣雙方在分類廣告式市集中交易。代理人替69名員工以禮物卡預算購買,並測試四種模型差異。結果顯示高階模型帶來較佳交易結果但當事人常不自覺。且初始指示影響有限。總計186筆成交,金額超過4000美元。
速報
加拿大AI新創Cohere宣布接管德國Aleph Alpha,並獲得Schwarz Group(Lidl母公司)以結構性資金支持。雙方在政府默認下打算整合資源,提出企業用的主權AI替代方案,目標鎖定防衛、能源、金融、醫療、製造與電信等高度管制產業及公部門。
速報
加拿大企業級人工智慧公司 Cohere 宣布與德國 Aleph Alpha 擬合併,雙方目標整合加德兩地人才與技術,打造一個具備更多資料控制與獨立性的跨大西洋 AI 平台。市場報導指出,合併後的新公司估值達 20 billion 美元,並有主要投資者承諾追加資金,Cohere 也正推進一輪大型融資。
速報
研究指出,人工智慧篩選求職者已廣泛應用,單一系統依賴存在風險。論文提出一個估計面板精準度的簡化公式,考量面板數量與AI間平均相關性ρ,並用該公式評估多元AI面板能否降低風險與提高選才穩定性。作者建議根據決策重要性調整面板規模,避免過度依賴單一AI。
速報
背景:為提升SoC安全,本研究將標準化威脅模型與形式驗證結合。方法:ATLAS以LLM從CWE辨識資產、對應弱點並自動產生assertion與JasperGold腳本,將弱點推理轉為形式證明。結果:於三項HACK@DAC基準上偵測39/48個CWE並為33項漏洞生成正確性質。
速報
以人工智慧輔助程式撰寫的潮流面臨兩大障礙:目標難以精準轉為提示(提示工程實際上屬於需求工程的一環)以及AI產生幻覺導致錯誤輸出。為提升程式實用性與正確性,研究主張把人工智慧的創意與形式化規格方法、形式化程式驗證結合,並以現代證明工具支援。
速報
研究團隊檢驗大型語言模型的上下文視窗效用。研究提出最大有效上下文視窗(MECW)定義,並設計跨長度與題型的測試方法,以及統一比較模型在放大上下文時的效能表現。結果顯示MECW顯著小於官方宣稱的最大上下文,且會隨題型變動,導致準確度與幻覺率出現顯著差異。
速報
研究以純語音為輸入,探索語法最初步的形成。本研究用ciwGAN/fiwGAN等卷積式生成對抗網路在單詞錄音上無監督訓練,模型卻自發生成兩字或三字的串接輸出,顯示網路可能產生組合性先兆,並提出去抑制(disinhibition)的神經機制模型。