QSAR模型,即定量構效關係(Quantitative Structure-Activity Relationship)模型,是一種研究化合物的化學結構與生物活性之間定量關係的方法,屬於計算機輔助藥物設計(Computer-Aided Drug Design, CADD)中最重要的工具之一。其目的是建立數學模型,幫助藥物科學家對新的藥物分子的性質開展合理預測,通過這種模型,研究人員可以預測未測定性質的分子的生物活性,從而指導藥物設計的過程。
QSAR模型的發展隨著分子表徵的演進和對應機器學習模型的升級而不斷變化。它包括以下幾個關鍵步驟:
分子表示。這是構建QSAR模型的關鍵步驟,涉及將分子結構轉化為計算機可讀的數值表示,例如1D-QSAR、2D-QSAR和3D-QSAR等。
選擇合適的機器學習模型。使用已有的分子-性質數據來訓練模型。
預測未測定性質的分子。訓練好的模型可以用來預測未知分子的性質。
近年來,隨著人工智慧技術(特別是深度學習)的發展,分子資料庫的迅速增長和計算能力的顯著提升,出現了「深度QSAR」,這是一個利用深度生成和強化學習方法在分子設計中的套用、用於合成規劃的深度學習模型,以及在基於結構的虛擬篩選中套用深度QSAR模型的新領域。
QSAR模型的套用範圍廣泛,包括藥物設計、農藥開發、環境科學研究等,對於新藥研發過程中的活性分子篩選、高毒性藥物分子的早期篩查、模擬藥物的吸收分布代謝排泄等方面都發揮著重要作用。