所謂的ICCV就是計算機視覺的三大國際學(xué)術(shù)會議之一,基本都是兩年舉行一場,每一年的會議都會吸引的無數(shù)的愛好者以及研究人員和開發(fā)者。在本月的20號,不少集團(tuán)或是知名高校都參與了此次比賽中,如網(wǎng)易互娛、螞蟻集團(tuán)、美團(tuán)、加州大學(xué)伯克利分校、復(fù)旦大學(xué)等,此次令人意外的是,網(wǎng)易互娛在本次的競賽中奪得冠軍。
ICCV是計算機視覺的三大國際頂級學(xué)術(shù)會議之一,共同探討計算機視覺領(lǐng)域的前沿研究與應(yīng)用。人體重識別(Person Re-ID)技術(shù)一直是計算機視覺研究的重要領(lǐng)域,在人體理解、行人跟蹤、智能安防、智慧零售等領(lǐng)域都有著廣泛的應(yīng)用。該競賽主要目的在于,不使用任何預(yù)訓(xùn)練模型、在數(shù)據(jù)量很少的前提下訓(xùn)練高精度的人體重識別模型,同時能夠降低人體對視覺上的依賴性,能夠更好的增加模型的演練與實用。
此次競賽僅提供一個包含436個ID人物的8569張圖片的訓(xùn)練集,并且要求不能使用任何預(yù)訓(xùn)練模型和額外的數(shù)據(jù)。數(shù)據(jù)量少、預(yù)訓(xùn)練先驗不可用、數(shù)據(jù)存在嚴(yán)重的遮擋等問題,嚴(yán)重影響著模型的準(zhǔn)確性和泛化能力,而這些問題也是實際業(yè)務(wù)中經(jīng)常會遇到的難點。網(wǎng)易互娛AI Lab團(tuán)隊?wèi){借以往對業(yè)務(wù)數(shù)據(jù)的敏感性和豐富的處理經(jīng)驗,針對這些難點,提出了基于主干網(wǎng)絡(luò)+特征聚合+雙損失的人體重識別框架,利用三元組損失和中心損失、多主干網(wǎng)絡(luò)集成等方法提高所提取特征的判別性。同時,通過隨機擦除、局部灰度變換、非平衡ID修正等多種方法提高模型的泛化性。另外利用訓(xùn)練損失大小過濾噪聲數(shù)據(jù)、以及挖掘難樣本數(shù)據(jù),有效地解決了原始數(shù)據(jù)中不同程度的遮擋問題。最后,采用重排序和查詢拓展等技術(shù),進(jìn)一步提高模型的性能。最終在數(shù)據(jù)有限的情況下,Mean Average Precision(mAP)達(dá)到了96.52%的高準(zhǔn)確度,相較于比賽方所提供的67% mAP的基線模型,大幅提升近30%。
以上人體重識別競賽方案的相關(guān)技術(shù)來自網(wǎng)易互娛AI Lab長期的技術(shù)儲備和積累,目前,這些技術(shù)已應(yīng)用于Aegis圖像語音審核引擎中,依托前沿的計算機視覺和語音信號處理技術(shù),該引擎每天處理數(shù)千萬圖片和音頻數(shù)據(jù),目前該技術(shù)已跟進(jìn)網(wǎng)易旗下的游戲軟件內(nèi),在休閑娛樂的同時也要注意社交禮儀,杜絕出現(xiàn)色情、暴力、辱罵等現(xiàn)象,為游戲的正常運營保駕護(hù)航。
網(wǎng)易互娛AI Lab正式創(chuàng)辦于17年,當(dāng)前此技術(shù)已跟進(jìn)網(wǎng)易所開發(fā)的游戲軟件內(nèi),如:《陰陽師》、《哈利波特—魔法覺醒》、《荒野行動》等這些都是網(wǎng)易所開發(fā)出的游戲。