擴散模型是一種用於描述系統中擴散過程的數學模型,也屬於一類生成模型,廣泛應用於圖像處理和深度學習領域。
擴散模型的工作原理是通過一箇正向過程(前向過程)逐漸向數據中加入噪聲,通常直到數據滿足高斯噪聲分佈,然後通過一箇反向過程(逆過程)預測每一步加入的噪聲,並通過去除噪聲的方式逐步還原數據。這個過程本質上是馬爾可夫架構的,訓練過程中利用了深度學習的反向傳播技術。擴散模型的靈感來源於非平衡熱力學,它們定義了一箇馬爾可夫擴散步驟鏈,以緩慢地將隨機噪聲添加到數據中,然後學習逆轉擴散過程以從噪聲中構建所需的數據樣本。
擴散模型的應用範圍廣泛,包括但不限於:
在化學中描述分子間的擴散運動。
在社會學中描述信息、想法或行爲在人羣之間的傳播。
視覺生成任務,如圖像超分辨率、去模糊、JPEG僞影移除、陰影移除、去霧/霾/雨等。
受到文本到圖像的生成應用的廣泛應用。
使用擴散模型時,需要輸入初始條件和其他參數,然後通過數學方法解決模型方程。這些方程的解可以用來預測未來的擴散情況或回顧過去的擴散情況。
儘管擴散模型具有廣泛的應用,但它們也有自己的侷限性。例如,擴散模型可能無法準確地描述沒有規律或隨機性較大的擴散過程。此外,擴散模型通常假設傳播過程是相對獨立的,但在現實生活中,傳播過程往往受到各種複雜因素的影響,這些因素可能無法被擴散模型所描述。