正則表達式,又稱規則表達式,(Regular Expression,在代碼中常簡寫為regex、regexp或RE),是一種文本模式,包括普通字元(例如,a到z之間的字母)和特殊字元(稱為「元字元」),是計算機科學中的一個概念。正則表達式使用單個字元串來描述、匹配一系列符合某個句法規則的字元串,通常被用來檢索、替換那些符合某個模式(規則)的文本。
正則表達式是對字元串操作的一種邏輯公式,就是用事先定義好的一些特定字元以及這些特定字元的組合,組成一個「規則字元串」,這個「規則字元串」用來表達對字元串的一種過濾邏輯。許多程式設計語言都支持利用正則表達式進行字元串操作,如Scala、PHP、C#、Java等。
此外,正則表達式中還有一些特殊的元字元和語法規則,例如:
. :匹配除換行符以外的任意字元。
\w:匹配字母或數字或下劃線或漢字。
\s:匹配任意的空白符。
\d:匹配數字。
\b:匹配單詞的開始或結束。
:匹配字元串的開始。
$:匹配字元串的結束。
通過使用這些元字元和語法規則,可以構造出非常靈活和強大的正則表達式,以滿足各種複雜的字元串匹配和處理需求。