
在CVPR'23上成功舉辦了第一屆Rhobin研討會后,此次為期半天的第二屆Rhobin研討會將繼續為展示和討論從圖像中重構人與物體交互的前沿研究提供平臺。與第一屆研討會相比,本次研討會的重點將不僅限于基于圖像的交互重構,還將擴展到對交互過程的跨時間跟蹤,并尋求與相關主題的聯系,例如以自我為中心的視覺和動態場景交互。第二屆Rhobin挑戰賽將包括五個賽道,其中新增了兩項人與物體交互跟蹤和基于圖像的接觸估計任務,使用兩個新的數據集InterCap和DAMON以及BEHAVE。
鑒于人與物體交互的重要性,正如本次研討會所強調的,競賽提出一項挑戰,即從單色RGB圖像中重建3D人體和物體,并估計3D人體-物體和人體-場景接觸。競賽已經在從單張圖像中重建人體網格或估計6自由度物體姿態方面取得了令人鼓舞的進展。然而,大多數這些工作都專注于無遮擋的圖像,這在近距離的人體-物體交互場景中并不現實,因為人類和物體會相互遮擋。這使得推理更加困難,并對現有的頂級方法提出了挑戰。同樣,估計3D接觸的方法也取得了快速進展,但僅限于掃描或合成數據集,在泛化到野外場景方面存在困難。在這次研討會上,我們希望考察現有的人體和物體重建以及接觸估計方法在更現實的場景下的表現,更重要的是,了解它們如何相互受益以實現準確的交互推理。最近發布的BEHAVE(CVPR'22)、InterCap(GCPR'22)和DAMON(ICCV'23)等數據集,使競賽可以在真實環境中對人與物體的交互進行聯合推理,并評估在野外環境中的接觸預測。
競賽分為五個賽道(track):
T1:3D人體重建
T2:6自由度剛體物體姿態估計
T3:人體與物體關節重構
T4:基于視頻的跟蹤
T5:從2D圖像預測3D接觸
vRobotit實驗室成績:
實驗室組織3個隊伍,以北京郵電大學為牽頭單位參加了3個賽道的比賽,獲得T1(亞軍) 、T3 (冠軍)、T5(第4)。