模仿學習是一種學習模式,其核心特徵在於仿效榜樣的行為方式。
模仿學習也被稱為基於演示的學習、學徒學習。這種學習方式不同於直接學習,後者是通過直接對刺激作出反應、以嘗試錯誤為特徵。模仿學習通常涉及觀察和複製示範者的行為,例如,在機器學習和人工智慧領域,模仿學習被用來訓練機器複製人類的連續動作。模仿學習不僅體現在人類的行為中,如在沒有外界控制條件下,個體受他人影響而仿效其言行,使自己的言行與示範者相同或相似的過程。在機器學習和人工智慧領域,模仿學習的方式主要有兩種:行為克隆和逆向強化學習。行為克隆關注於從示範者的行為中提取信息來訓練機器;逆向強化學習則側重於理解導致這些行為的結果,從而推斷出獎勵函式。