計算PL(Phred Scale)的基本公式是:
PL = -10 * log(P(Data|Genotype))
其中,P(Data|Genotype)是根據觀察到的數據D計算出的基因型爲G的條件概率。這個概率可以通過計算基因型爲G的樣本在所有可能的基因型中的比例得到。將P(Data|Genotype)取log值並乘以-10後,將其轉換爲Phred-scale格式,即得到PL值。最後,將所有基因型的PL進行歸一化,使得最有可能的基因型(即AA)的PL爲0。
對於二倍體基因組(如人類),可以將樣本里每個位點的三種基因型代入公式,得到該樣本在每一箇位點上三種基因型的PL值。例如,如果參考序列鹼基爲A,突變鹼基爲C,那麼該位點上AA、AC和CC這三個不同基因型各自的後驗概率假設如下:
Pr(AA|data) = 0.001
這裏的log是對數函數,底數爲10。