勵志

勵志人生知識庫

blast e值

BLAST是一種在生物信息學中常用的序列比對算法,用於發現蛋白質或核酸的相似序列。在BLAST的結果中,E值(E-value)是一個重要的指標,它代表了隨機匹配的可能性。E值越小,表明隨機序列與目標序列相似度超過當前序列的可能性越低,因此E值越低,結果越可靠。通常認為,當E值小於10^-5時,兩序列具有較高的同源性,而當E值小於10^-6時,兩序列的同源性非常高,幾乎不需要進一步的確認。

E值的計算公式為:E=K*m*n*(e^-lambda*S),其中K和lambda是與資料庫和算法相關的常量,m是目標序列的長度,n是資料庫的大小,S是BLAST結果中的S值。當E值接近零或為零時,基本上表示完全匹配。

在BLASTP搜尋中,可以通過調整f參數來比較不同閾值水平下的影響。E值的計算是基於隨機條件下得分至少為某個特定值S的HSP(High-scoring Segment Pair)的期望值。隨著S的增加,E值成指數下降,當E值接近零時,一個比對隨機發生的可能性接近於0。