勵志

勵志人生知識庫

什麼是fcn

語義分割的全卷積網絡

FCN 的全稱是 Fully Convolutional Networks for Semantic Segmentation,即語義分割的全卷積網絡。它是一種用於圖像語義分割的深度學習框架,由Jonathan Long等人於2015年提出。FCN的主要特點是:

全卷積層:替代了傳統CNN中的全連接層,使用卷積層來提取特徵。

上採樣:爲了解決卷積和池化操作導致的圖像尺寸變小,使用上採樣技術恢復圖像到原始尺寸。

反捲積層:通過上採樣得到原尺寸的語義分割圖像,使得網絡能夠對每一箇像素進行分類預測。

跳級結構:結合不同深度層的結果,確保網絡的魯棒性和精確性。

FCN的輸入可以是任意尺寸的彩色圖像,輸出與輸入尺寸相同,通道數爲目標類別數加上1(背景)。它不需要裁剪圖像到指定大小,因此輸入圖像尺寸可以不同。此外,FCN的輸出通常是熱力圖,而不是類別標籤。

FCN的出現是深度學習在圖像語義分割領域的里程碑,幾乎所有後續的圖像語義分割模型都受到了FCN的影響。它的結構主要由全卷積部分和反捲積部分組成,其中全卷積部分用於提取特徵,反捲積部分通過上採樣得到原尺寸的分割結果。