超參數是在機器學習算法中需要手動設置的參數,用於控制模型的結構和訓練過程,而不是通過學習和優化來確定的。
這些參數定義了模型的更高層次的概念,如複雜性或學習能力,它們不能直接從數據中學習,需要預先定義。常見的超參數包括學習率、正則化參數、批量大小、迭代次數、隱藏層的數量和大小、卷積神經網絡中的濾波器大小和數量等。超參數的選擇對模型的性能和訓練過程非常重要,不同的超參數值可能導致不同的模型性能,因此需要通過嘗試不同的超參數組合來找到最佳的配置。這通常需要進行交叉驗證或使用其他技術來評估不同超參數組合的性能。