為了促進(jìn)對于大規(guī)模時(shí)空范圍內(nèi)的人群活動(dòng)的長時(shí)間、長距離分析,清華大學(xué)推出一個(gè)新的十億像素級別視頻數(shù)據(jù)集:PANDA。
該數(shù)據(jù)集在自然場景中由十億像素相機(jī)收集,能同時(shí)保證寬視場(最大可覆蓋1平方千米的自然場景)和高分辨率(每幀視頻接近10億像素),以此提供一個(gè)標(biāo)準(zhǔn)化的評測基準(zhǔn),促進(jìn)新的算法來理解大規(guī)?,F(xiàn)實(shí)世界場景中復(fù)雜的人群活動(dòng)及社交行為。
近日,百度智能云數(shù)據(jù)眾包與清華大學(xué)開展項(xiàng)目合作,推進(jìn)全球首個(gè)十億像素級視頻數(shù)據(jù)集PANDA的建設(shè)工作,用以支持未來在公共安全、智慧城市、虛擬現(xiàn)實(shí)等領(lǐng)域的各項(xiàng)研究及應(yīng)用。
本次項(xiàng)目共完成7200余幀億級像素圖片,共計(jì)超過106萬張切圖的數(shù)據(jù)標(biāo)注工作,包括物體間關(guān)系近2萬組、交互行為近20萬個(gè)、移動(dòng)物體軌跡點(diǎn)近30萬組,以及數(shù)十億3D點(diǎn)云數(shù)據(jù)的語義分割及實(shí)例標(biāo)注。
據(jù)了解,PANDA是全球首個(gè)十億像素級視頻數(shù)據(jù)平臺,它突破了人眼視覺分辨率的極限,賦予視覺計(jì)算更高質(zhì)、更真實(shí)、更全面的源數(shù)據(jù),填補(bǔ)了國際上“寬視場、多對象、高分辨率”數(shù)據(jù)平臺的空白,為新一代智能處理技術(shù)研究提供了不可或缺的數(shù)據(jù)基礎(chǔ)。
清華大學(xué)電子工程系副教授、PANDA 數(shù)據(jù)集項(xiàng)目負(fù)責(zé)人方璐介紹,此前清華大學(xué)團(tuán)隊(duì)曾圍繞 PANDA 數(shù)據(jù)集,在計(jì)算機(jī)視覺頂級國際會(huì)議ECCV 2020上,組織了GigaVision 2020挑戰(zhàn)賽并引起廣泛關(guān)注。
目前,團(tuán)隊(duì)正在籌辦ACMMM 2021會(huì)議的GigaVision主題挑戰(zhàn)賽,以及全球人工智能技術(shù)創(chuàng)新大賽。