版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-排斥損失

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

排斥損失(Repulsion Loss)用于解決密集人群檢測(cè)中人與人之間存在大量遮擋以致難以準(zhǔn)確定位人群中單個(gè)人的問(wèn)題。排斥損失由吸引項(xiàng)和排斥項(xiàng)構(gòu)成,其中,吸引項(xiàng)用于縮小預(yù)測(cè)框與其指定目標(biāo)之間差距,排斥項(xiàng)用于增大預(yù)測(cè)框與周?chē)悄繕?biāo)物體之間的距離。

設(shè)計(jì)思想因?yàn)樵诂F(xiàn)實(shí)場(chǎng)景中行人經(jīng)常聚集成群、相互遮擋,因此,檢測(cè)人群中的行人依然是一個(gè)充滿挑戰(zhàn)性的問(wèn)題。一般而言,物體遮擋問(wèn)題可以分為類(lèi)內(nèi)遮擋和類(lèi)間遮擋兩種情況。類(lèi)間遮擋產(chǎn)生于扎堆的同類(lèi)物體,也被稱(chēng)為密集遮擋(crowd occlusion)。在行人檢測(cè)中,密集遮擋在所有遮擋問(wèn)題中占比最大,嚴(yán)重影響著行人檢測(cè)器的性能。1

密集遮擋顯著增加了行人定位的難度。如圖1,當(dāng)目標(biāo)行人 T 被行人 B 遮擋之時(shí),由于兩者外觀特征相似,檢測(cè)器很可能無(wú)法進(jìn)行定位。從而本應(yīng)該框定 T 的邊界框轉(zhuǎn)而框定 B,導(dǎo)致定位不準(zhǔn)確。更糟糕的是,由于非極大值抑制(non-maximum suppression,NMS)需要進(jìn)一步處理主要的檢測(cè)結(jié)果,從 T 移走的邊界框可能會(huì)被 B 的預(yù)測(cè)框抑制,進(jìn)而造成 T 漏檢。即人群遮擋使得檢測(cè)器對(duì)非極大值抑制(NMS)閾值很敏感:較高的閾值會(huì)帶來(lái)更多的誤檢(false positives),較低的閾值則造成更多的漏檢(missed detection)。這會(huì)讓大多數(shù)實(shí)例分割框架失效,因?yàn)樗鼈円残枰_的檢測(cè)結(jié)果。因此,如何精確地定位人群之中的每個(gè)行人是檢測(cè)器最為關(guān)鍵的問(wèn)題之一。

在當(dāng)前最優(yōu)的檢測(cè)框架中,邊界框回歸技術(shù)常用來(lái)定位物體,其中回歸器被訓(xùn)練用來(lái)縮小候選區(qū)域提議和真值框之間的差距。盡管如此,現(xiàn)有方法只需要候選區(qū)域提議接近其指定目標(biāo),并不考慮周遭的物體。如圖 1 所示,在標(biāo)準(zhǔn)的邊界框回歸損失中,當(dāng)預(yù)測(cè)框移向周遭物體時(shí),對(duì)其并沒(méi)有額外的懲罰。這不免使人設(shè)想:如果要檢測(cè)人群之中的一個(gè)目標(biāo),是否應(yīng)該考慮其周遭物體的定位?

在磁極相互排斥吸引的啟發(fā)下,wang等1提出一種全新的定位技術(shù),稱(chēng)之為 Repulsion Loss(RepLoss),通過(guò)它,每一個(gè)候選區(qū)域提議不僅會(huì)靠近其指定目標(biāo) T,還會(huì)遠(yuǎn)離其它真值框物體以及指定目標(biāo)不是 T 的其他 候選區(qū)域提議。如圖 1 所示,由于與周遭的非目標(biāo)物體重疊,紅色邊界框移向 B 將受到額外的懲罰。因此,RepLoss 可以有效防止預(yù)測(cè)邊界框移向相鄰的重疊物體,提升檢測(cè)器在人群場(chǎng)景中的魯棒性。

RepLoss 計(jì)算方法RepLoss 包括 3 個(gè)組件,表示為:

其中, 是吸引項(xiàng),需要預(yù)測(cè)框靠近其指定目標(biāo); 是排斥項(xiàng),分別需要預(yù)測(cè)框遠(yuǎn)離周遭其他的 groundtruth 物體和其他指定目標(biāo)不同的預(yù)測(cè)框。系數(shù)α和 β 充當(dāng)權(quán)重以平衡輔助損失。

為簡(jiǎn)明起見(jiàn),下面僅考慮兩類(lèi)檢測(cè),假定所有的真值框物體屬于同一類(lèi)別。分別使 為候選區(qū)域提議邊界框和真值邊界框,并分別由它們的左上點(diǎn)坐標(biāo)及其高度、寬度表示。 是所有正候選區(qū)域提議的集合(那些和至少一個(gè)真值框有高 IoU 的被視為正樣本,反之為負(fù)樣本); 是一張圖片中所有真值框的集合。1

吸引項(xiàng)給定一個(gè)候選區(qū)域提議 ,把具有極大值 IoU 的 groundtruth box 作為其指定目標(biāo): 。由此吸引損失可計(jì)算為:

排斥項(xiàng)(RepGT)RepGT 損失旨在使候選區(qū)域提議受到相鄰的非目標(biāo) groundtruth 物體的排斥。給定一個(gè)候選區(qū)域提議,它的排斥 groundtruth 物體被定義為除了其指定目標(biāo)之外帶有最大 IoU 區(qū)域的 groundtruth 物體。受 IoU 損失的啟發(fā),RepGT 損失被計(jì)算以懲罰 P和之間的重疊。從而 ,RepGT 損失可寫(xiě)為:

其中,,,

候選區(qū)域提議越傾向于與非目標(biāo)groundtruth 物體重疊,RepGT 損失對(duì)邊界框回歸器的懲罰就越大,從而有效防止邊界框移向相鄰的非目標(biāo)物體。1

排斥項(xiàng)(RepBox)NMS 是絕大多數(shù)檢測(cè)框架中不可或缺的后處理步驟,為降低檢測(cè)器對(duì) NMS 的敏感度,Wang等1接著提出 RepBox 損失,排斥來(lái)自不同指定目標(biāo)的 proposal。RepBox 損失可計(jì)算為:

從上式可以看到,為最小化 RepBox 損失,指定目標(biāo)不同的兩個(gè)預(yù)測(cè)框之間的 IoU 區(qū)域需要較小。這意味著 RepBox 損失可以降低 NMS 之后不同回歸目標(biāo)的邊界框合并為一的概率,使得檢測(cè)器在密集場(chǎng)景中更魯棒。1

本詞條內(nèi)容貢獻(xiàn)者為:

李嘉騫 - 博士 - 同濟(jì)大學(xué)