編輯|張倩、陳陳
剛剛,AAAI 2026 官網公佈了今年的「傑出論文」(相當於最佳論文)獎項,共有 5 篇論文獲獎,其中有三篇由華人團隊主導,作者來自香港科技大學(廣州)、西湖大學、浙江大學、同濟大學、浙江師範大學、香港城市大學等多所國內高校論文。
AAAI 由國際人工智慧促進協會主辦,是人工智慧領域歷史最悠久、涵蓋內容最廣泛的國際頂級學術會議之一,也是中國計算機學會(CCF)推薦的 A 類國際學術會議,每年舉辦一屆論文。
AAAI 2026 於 1 月 20 日至 27 日在新加坡舉行,總投稿數為 23,680 篇,錄用論文 4,167 篇,接收率為 17.6%論文。
以下是獲獎論文的具體情況論文。
論文 1論文:ReconVLA: Reconstructive Vision-Language-ActionModel as Effective Robot Perceiver
展開全文
作者論文:Wenxuan Song, Ziyang Zhou, Han Zhao, Jiayi Chen, Pengxiang Ding, Haodong Yan, Yuxin Huang, Feilong Tang, Donglin Wang, Haoang Li
機構論文:香港科技大學(廣州)、西湖大學、浙江大學、莫納什大學
論文連結論文:
專案主頁論文:
近年來,視覺 — 語言 — 動作(VLA)模型的進展,使機器人智慧體能夠將多模態理解與動作執行相結合論文。然而,實證分析發現,現有的 VLA 模型在將視覺注意力分配到目標區域時仍然存在明顯困難,其注意力往往呈現分散狀態。
為引導視覺注意力在正確目標上的有效 grounding ,作者提出了 ReconVLA,一種採用隱式對齊正規化的重建式 VLA 模型論文。
該方法以模型的視覺輸出為條件,引入擴散 Transformer 來重建影像中的注視區域(gaze region),而這一注視區域正對應於被操作的目標物體論文。透過這一過程,VLA 模型被促使學習更加細粒度的表徵,並能夠準確分配視覺注意力,從而更充分地利用任務相關的視覺資訊,完成精確操作。
此外,作者構建了一個大規模預訓練資料集,包含來自開源機器人資料集的十萬餘條軌跡和兩百萬條資料樣本,進一步提升了模型在視覺重建任務上的泛化能力論文。大量模擬與真實環境中的實驗結果表明,論文提出的隱式對齊方法具備明顯優勢,在精細操作能力和泛化表現上均有出色表現。
論文 2論文:LLM2CLIP: Powerful Language Model Unlocks Richer Cross-Modality Representation
作者論文:Weiquan Huang, Aoqi Wu, Yifan Yang, Xufang Luo, Yuqing Yang, Usman Naseem, Chunyu Wang, Qi Dai, Xiyang Dai, Dongdong Chen, Chong Luo, Lili Qiu, Liang Hu
機構論文:同濟大學、微軟、麥考瑞大學
論文連結論文:
論文主頁論文:
CLIP 是一種具有奠基意義的多模態模型,它透過在數十億規模的影像 — 文字配對資料上進行對比學習,將影像與文字對映到同一表示空間論文。
受到 LLM 迅猛發展的啟發,作者探討了如何利用 LLM 更強的語言理解能力與廣泛的世界知識來進一步增強 CLIP,尤其是在處理冗長且結構複雜的描述文字時的表現論文。為此,他們提出了一種高效的微調框架,將 LLM 嵌入到預訓練的 CLIP 中,而訓練成本幾乎與常規的 CLIP 微調相當。具體而言,該方法首先將 LLM 轉化為適配 CLIP 場景的「嵌入化」形式,隨後透過一個輕量級介面卡將其與預訓練的 CLIP 視覺編碼器耦合,該介面卡僅需在數百萬規模的影像 — 文字對上進行訓練。
藉助這一策略,作者在無需大規模重新訓練的前提下,相較於 EVA02、SigLIP-2 等當前最先進的 CLIP 變體,取得了顯著的效能提升論文。經 LLM 增強後的 CLIP 在多種下游任務上均表現出穩定改進,包括線性探測分類、同時支援短文字與長文字(英文及多語言)的零樣本影像 — 文字檢索、零樣本與有監督的影像分割、目標檢測,以及作為多模態大模型基準中的分詞器使用。
論文 3論文:Model Change for Description Logic Concepts
作者論文:Ana Ozaki, Jandson S Ribeiro
機構論文:奧斯陸大學、卡迪夫大學
論文連結論文:暫無
該論文雖已獲獎,但目前還未公開發布論文。
論文 4:Causal Structure Learning for Dynamical Systems with Theoretical Score Analysis
作者論文:Nicholas Tagliapietra, Katharina Ensinger, Christoph Zimmer, Osman Mian
機構論文:博世 AI 中心團隊、德國達姆施塔特工業大學、德國醫學 AI 研究所 IKIM 等
論文連結論文:
現實世界中的系統通常按照其內在的因果關係在連續時間中演化,但這些動態機制往往是未知的論文。現有用於學習此類動態的方法通常存在兩類問題:要麼對時間進行離散化處理,在面對不規則取樣資料時效能較差;要麼忽略了系統背後的因果結構。
為此,本文提出 CADYT,一種用於動力系統因果發現的新方法,可以同時解決上述兩大挑戰論文。不同於當前主流將問題建模為離散時間動態貝葉斯網路的因果發現方法,該研究建模基礎是基於差分的因果模型,這種模型對連續時間系統的刻畫只需更弱的假設,更符合真實系統的連續演化特性。
CADYT 採用精確的高斯過程推斷來建模連續時間動力學,從而在建模層面更貼近系統的真實生成過程論文。在演算法設計上,本文提出了一種可落地的實現方案:透過結合馬爾可夫條件與最小描述長度(MDL)原則,採用貪心搜尋策略來識別系統的因果結構。
CADYT 能夠從連續時間動力系統的軌跡資料中,發現未知的因果結構論文。
實驗結果表明,無論是在規則取樣還是不規則取樣的資料場景下,CADYT 都顯著優於現有的先進方法,能夠恢復出更接近真實底層動力學機制的因果網路結構論文。
論文 5論文:High-Pass Matters: Theoretical Insights and Sheaflet-Based Design for Hypergraph Neural Networks
這篇獲獎論文同樣還沒有放出論文連結,但從附錄論文中,我們獲悉了作者機構資訊論文。
作者:Ming Li, Yujie Fang, Dongrui Shen, Han Feng, Xiaosheng Zhuang, Kelin Xia, Pietro Lio
機構論文:浙江師範大學、香港城市大學、南洋理工大學、劍橋大學
論文連結論文:暫無
參考連結論文: