助力AI創新眾智生態，全球首個十億像素級CV挑戰賽GigaVision落幕

:0:0

圍繞十億像素級計算機視覺技術的2022 GigaVision 挑戰賽，在經歷四個月的激烈角逐后，于近日落下帷幕。

2022 GigaVision挑戰賽開放百萬元獎金池，面向全球高等院校、研究機構、高新企業及個人愛好者征集原創算法。
不同于其它視覺算法挑戰賽，GigaVision挑戰賽是全球首個針對大場景、多對象及復雜關系問題的智能算法比賽，是新一代人工智能算法的試金石。
依托自研的億像素光場成像設備，大賽構建了具有寬視場、高分辨率的GigaVision平台，延展出當下若干人工智能技術發展的關鍵問題。平台目前包括兩個「世界首個」級別的子項目：
PANDA：世界首個十億像素級以人類為中心的視訊數據集，具有大場景、多對象、長時程及復雜關系等特點； GigaMVS：世界首個十億像素級超大規模場景三維重建基準，具有規模大、細節分辨率高、遮擋復雜等特點，可使多視角三維重建與渲染問題發生質變。
值得一提的是，這已是GigaVision挑戰賽連續第四年舉辦，且一直與CVPR、ACM MM、ECCV等頂會有著緊密合作。
那麼本屆GigaVision挑戰賽又帶了怎樣的驚喜？
賽事升級聚力創新在GigaVision挑戰賽中，每一張圖片、視訊的每一幀都是十億像素級別。比如GigaMOT賽道，參賽者需要評估MOT模型在十億像素視訊中對多個目標跟蹤任務的準確性，既要解決單目標跟蹤任務的互相遮擋、運動模糊、擁擠場景、尺度變化等難點，又要處理目標軌跡的起始與終止、相似目標間的相互干擾等問題。特別是該賽道所使用的PANDA-Video大場景數據集，其可視范圍大、擁擠行人的復雜場景等特點也為傳統數據集上的MOT算法帶來了新的挑戰。

△基于十億像素視訊的多目標跟蹤示例
又比如在GigaRendering賽道中，參賽者需要在給定的不同場景經過校準的十億像素圖像中，面對稀疏視角下的高分辨率、寬視場、細節豐富的難點，渲染生成新的RGB視圖并盡可能提升其準確性。十億像素級別的圖像渲染任務，對神經輻射場的表達、規模和效率提出了更高的挑戰。

△十億像素圖像渲染新視圖示例
此外，偏好原始創新的測評方式亦是GigaVision挑戰賽的一大亮點。傳統的人工智能挑戰賽任務普適性強、辦賽周期短，大部分參賽隊伍傾向利用成熟的理論框架和工程套路，實現系統集成和參數調優，反復刷榜。完全以分數導向的測評方式，阻礙了技術的原始創新。相比之下，GigaVision挑戰賽形成了固定的舉辦周期，并將方法的前沿性、原創性作為排名的重要依據之一，更能鼓勵參賽隊伍進行原始創新。
可以看到，GigaVision挑戰賽看似仍在比拼視覺智能領域的幾大經典研究問題，但面向「十億像素」級圖像視訊數據，賽題的前沿性、挑戰性、創新性和開拓性大幅提升，與經典問題截然不同。以往將整個圖像或視訊放進網絡中直接處理的傳統方法不再奏效，僅僅使用單個模型或幾個模型也很難完成這種級別的任務。因此，參賽團隊會更加專注于「卷」模型架構的設計，致力于探索模型能力的上限，開展更多理論層面的創新嘗試。
經過多輪比拼、線上評測、結果復現和視訊答辯，本屆大賽獲得了多目標檢測、多目標跟蹤、多目標軌跡預測、3D重建、3D渲染、密集人群三維重建等方面的多個創新性解決方案，這些作品均具有很高的準確性和領先性，為十億像素計算機視覺的發展帶來了啟發。
幾年來，GigaVision數據平台以賽為媒，已經與CVPR、ICCV、ECCV、ACM MM等國際頂會聯合舉辦了多屆Workshops和Challenges。系列賽事的舉辦水平不斷提升，參賽規模不斷增長，關注度和影響力越來越高。
以賽為媒推進發展對于本屆賽事的舉辦以及參賽選手們的優異表現，組委會專家們表達了積極的肯定和最為真實的感受。
不同賽道上涌現出多個原創算法模型，大賽專家表示對十億像素計算機視覺的發展帶來了深遠的啟發：「經過嚴謹的線上評測、結果復現和視訊答辯，本屆賽事共獲得了多個原創算法模型，這些作品均具有很高的原創性和領先性，為十億像素計算機視覺的發展帶來了啟發。」
對于3D賽道相關作品，大賽專家給予了高度評價：「3D賽道相關作品結合了數字人、元宇宙熱點，具有很高應用潛力，且作品完成度較高，融合了基于人工智能的神經表征、可微渲染優化方法和基于多視圖幾何的立體匹配等經典方法，在算法設計和工程化實現上都頗具亮點，對大場景高精度三維重建任務具有較大的啟發性，展示出了巨大的落地應用潛力。」
隨著數字人、元宇宙概念的持續爆發，超高分辨率人體三維重建和新視點合成已經成為計算機視覺和計算機圖形學領域的研究熱點，未來可針對十億像素級別的人體三維重建或新視點合成任務開展新的賽道，更好地支撐相關領域的發展，同時進一步擴大GigaVision挑戰賽的影響力。
同時，參賽選手的「創新」和「大膽」，也被評價為推動領域發展的關鍵：在目標檢測賽道中，參賽選手全面分析了寬視場高分辨視覺數據中場景大、對象多等新特點所帶來的新問題，圍繞著場景全局稀疏局部稠密、對象尺度多變形態復雜、數據通量大等挑戰，提出了一系列目標檢測新算法與新模型，相較現有前沿算法，實現了精度與效率的顯著提升。參賽選手們的奇思妙想與大膽創新為目標檢測領域提供了有效且有趣的新思路，對推動本領域的發展有重要作用。
未來，GigaVision挑戰賽將不斷努力，提高評價標準，提供更多的技術評價機會，邀請更多的國內外知名高校、人工智能企業以及專家學者參與評價工作，以增強評價的公正性和權威性。同時，GigaVision挑戰賽將不斷拓展與其他相關領域的合作，以提高競賽的國際影響力，為人工智能領域的發展提供更多的技術支持和潛在應用。

[圖擷取自網路，如有疑問請私訊]