齊夫定律(Zipf's law)是由哈佛大學的語言學家喬治·金斯利·齊夫於1949年發表的一種實驗定律。它可以表述為:在自然語言的語料庫里,一個單詞出現的頻率與它在頻率表里的排名成反比。例如,頻率最高的單詞出現的頻率大約是出現頻率第二位的單詞的2倍,而出現頻率第二位的單詞則是出現頻率第四位的單詞的2倍。齊夫定律是一個實驗定律,而非理論定律,它可以在很多現象中被觀察到。
齊夫定律的數學表達為f(r)∝1/r,其中f(r)表示頻率,r表示排名。這個定律被作為任何與冪定律機率分布有關的事物的參考。齊夫定律不僅在語言學中有廣泛套用,還在城市規模分布、網頁訪問頻率、收入分布等多個領域有所體現。
齊夫定律的成因是一個爭論的焦點。齊夫本人提出的「省力原則」假說認為,語言交流過程中存在使語言結構更為經濟的趨勢,這可能導致詞彙頻率的雙曲線型分布。此外,還有研究提出「成功產生成功」的假說,認為高頻詞彙的使用會因其自身的成功而更加頻繁。這些假說都試圖解釋為什麼齊夫定律會在多個領域中普遍存在。