空洞卷積(也稱為擴張卷積或atrous卷積)是一種在卷積神經網路中使用的技術,主要用於增加卷積核的感受野,同時保持計算量和特徵圖解析度不變。
在標準的卷積過程中,卷積核在輸入特徵圖上連續滑動進行計算,而在空洞卷積中,卷積核的元素之間可以加入一定的間隔(即「空洞」),這樣可以在不增加額外參數的情況下擴大卷積核的有效覆蓋範圍。這種技術特別適用於需要較大感受野的任務,如圖像分割和語義分割,在這些任務中,算法需要在保持詳細信息的同時捕獲更廣泛的上下文信息。
空洞卷積通過引入一個稱為「擴張率」(dilation rate)的參數來控制卷積核中元素之間的間隔大小。例如,一個擴張率為2的3x3卷積核,在套用時會跳過一個像素進行計算,從而在相同參數量和計算量下獲得更大的感受野。
空洞卷積已經在多種套用中顯示出其有效性,包括但不限於圖像分割、語義分割、語音識別和自然語言處理等。