6月30日消息,澎思科技(Pensees)官方宣布其再次在單幀圖片數(shù)據(jù)集(Market1501,DukeMTMC-reID,MSMT17)刷新世界紀(jì)錄,大幅提升了跨域ReID算法的準(zhǔn)確率。
此前,澎思科技曾在三大主流單幀圖片行人再識別數(shù)據(jù)集、三大主流視頻行人再識別數(shù)據(jù)集刷新世界記錄。
據(jù)了解,澎思科技此次成果的取得源于澎思新加坡研究院對算法的自研創(chuàng)新和融合探索。本次,澎思科技將對抗生成網(wǎng)絡(luò)與自監(jiān)督學(xué)習(xí)算法結(jié)合進行模型的訓(xùn)練,通過遷移學(xué)習(xí),進行高準(zhǔn)確率的跨場景(數(shù)據(jù)庫)行人再識別算法的研發(fā),取得了突破性進展 。
澎思科技方面表示,該突破對于行人再識別技術(shù)在應(yīng)用場景中的落地具有重要的意義。
澎思科技對行人再識別(ReID)算法進行了長期關(guān)注的研究。行人再識別(ReID)算法能夠通過視頻監(jiān)控系統(tǒng),在跨攝像頭的條件下檢索行人,大大拓展攝像資源的利用深度。特別在公共安全領(lǐng)域,ReID可以彌補人臉識別的局限,提升對特定人物的識別追蹤能力,并大大降低人力成本。然而相比人臉識別的百萬級數(shù)據(jù)庫,行人再識別面臨著數(shù)據(jù)量不足和復(fù)雜應(yīng)用場景變化的挑戰(zhàn)。因此,展開高準(zhǔn)確率的跨場景(數(shù)據(jù)庫)行人再識別算法研究對于行人再識別技術(shù)的應(yīng)用落地十分重要。
此次澎思科技刷新的ReID三大數(shù)據(jù)集,除了Market1501,DukeMTMC-reID兩大常見數(shù)據(jù)集之外,還包含了MSMT17數(shù)據(jù)集。MSMT17,即Multi-Scene Multi-Time,是在CVPR 2018上提出的一個更接近真實場景的大型數(shù)據(jù)集,涵蓋了多場景多時段,是目前最賦有挑戰(zhàn)性的綜合跨場景大數(shù)據(jù)集。與之前的數(shù)據(jù)集相比,該數(shù)據(jù)庫中行人和攝像頭數(shù)目更多,覆蓋場景更復(fù)雜,時間跨度更廣。因此,在該數(shù)據(jù)集下模型的表現(xiàn)更能體現(xiàn)出算法的實力。
MSMT17 數(shù)據(jù)集與其他數(shù)據(jù)集的直觀對比
最終,通過與目前最新的主流算法進行對比,澎思科技的ReID算法無論在首位命中率(Rank-1 Accuracy),還是平均精度均值(Mean Average Precision,mAP)上的表現(xiàn)都明顯更好,準(zhǔn)確率更高。
本次,澎思科技創(chuàng)新性地將對抗生成網(wǎng)絡(luò)與自監(jiān)督學(xué)習(xí)算法結(jié)合進行模型的訓(xùn)練,通過遷移學(xué)習(xí),進行高準(zhǔn)確率的跨場景(數(shù)據(jù)庫)行人再識別算法的研發(fā),取得了突破性進展。
對抗生成網(wǎng)絡(luò)在算法中主要有兩個功能:一方面,進行數(shù)據(jù)庫的域遷移,具體為原域到目標(biāo)域的風(fēng)格遷移;另一方面,進行目標(biāo)域數(shù)據(jù)庫的數(shù)據(jù)增強,具體為生成跨攝像頭數(shù)據(jù)并給模型賦予相機風(fēng)格不變的約束。自監(jiān)督學(xué)習(xí)則是通過聚類的方式給目標(biāo)域數(shù)據(jù)庫打虛擬標(biāo)簽并微調(diào)之前訓(xùn)練好的網(wǎng)絡(luò)。
近年來,單域行人再識別(Single-Domain Person ReID)取得了巨大進展,但與實際應(yīng)用場景的要求還存在較大差距,跨域行人再識別(Cross-Domain Person ReID)的研究意義愈發(fā)顯著。隨著人工智能的不斷發(fā)展演進,如何通過自動遷移學(xué)習(xí)、自監(jiān)督學(xué)習(xí)、GAN等前沿技術(shù)實現(xiàn)模型優(yōu)化,成為跨域行人再識別的重要研究方向。
澎思科技此次創(chuàng)新性地通過遷移學(xué)習(xí)提升了目標(biāo)場景下的ReID性能,突破了行人再識別的落地應(yīng)用限制,真正發(fā)揮了ReID的算法作用和技術(shù)優(yōu)勢,為行人再識別算法在各類產(chǎn)品和應(yīng)用場景中的落地打下基礎(chǔ)。
關(guān)鍵詞: 澎思科技提升了跨域