班福定律,也被稱為本福特定律或本福特法則,是一種描述在自然出現或未經人為修飾的數據集中,各個數字的首位數字出現頻率的規律。這個定律指出,在一系列不規則數據中,以1為首位數字出現的機率最高,約為總數的三成,而以2為首位數字的機率小於以1為首的數字,以此類推,越大的數,以它為首位的數出現的機率就越低。具體來說,首位數是1的機率為lg(2/1),首位數是2的機率為lg(3/2),首位數為3的機率為lg(4/3),首位數為9的機率為lg(10/9)。
班福定律的套用主要包括兩個方面:
在審計實務中,尤其是在數據量較大的情況下,可以此建立審計模型進行樣本抽樣,提高審計抽樣效率,降低審計風險。例如,在審計費用開支的時候,套用班福定律,可能會發現某些數字高出正常不少,通過調閱憑證,也許會發現是下級部門為了躲避審批,採用化整為零的方法,把大額費用開支分成若乾筆處理。
科學家依據這一定律發現了2004年美國總統選舉中佛羅里達州的投票欺詐行為,2004年委內瑞拉的投票欺詐和2006年墨西哥投票欺詐。
需要注意的是,班福定律不適用於有內設的最高值和最低值的數據,也就是說必須自然分布,不能人為限制數字大小。同時,有編碼規律的數字,如身份證號、郵政編碼、銀行賬號等也不適用班福定律。