為什麼要激活函數

激活函數在神經網絡中起着至關重要的作用，主要原因包括：

引入非線性因素：線性模型具有有限的表達能力，因爲它們只能表示爲輸入的線性組合。通過引入非線性的激活函數，神經網絡能夠學習更加複雜的函數，從而解決更加複雜的問題。

解決梯度消失問題：在深度神經網絡中，如果沒有激活函數，反向傳播時梯度可能會消失，導致網絡難以學習。激活函數通過確保其輸出值不接近於零，可以避免這種情況，從而使得梯度下降法能夠有效地訓練網絡。

保持函數對稱性：激活函數應關於零點對稱，以避免在計算過程中激活值偏向一側。

計算效率：激活函數在神經網絡中需要被多次計算，因此它們應該具有較高的計算效率，以減少計算成本。

可微性：深度神經網絡通常通過梯度下降來優化權重，因此激活函數或其部分需要能夠微分，以便於計算損失函數的最小值。

綜上所述，激活函數是神經網絡中不可或缺的一部分，它們不僅提供了非線性的表達能力，還解決了梯度消失問題，保持了函數的性質，提高了計算效率，並確保了網絡的優化過程。