.NET 中的正則表達式是基于 Perl 5 的正則表達式。
超時
從 .NET Framework 4.5 開始,正則表達式支持在匹配操作中指定超時時間。如果匹配超時,就會拋出 RegexMatchTimeoutException 。
所有方法都增加了帶超時時間參數(shù)的重載:
public static Match Match(string input, string pattern, RegexOptions options, TimeSpan matchTimeout);
public static MatchCollection Matches(string input, string pattern, RegexOptions options, TimeSpan matchTimeout);
public static string Replace(string input, string pattern, string replacement, RegexOptions options, TimeSpan matchTimeout);
public static string[] Split(string input, string pattern, RegexOptions options, TimeSpan matchTimeout);
如果應(yīng)用程序需要處理任意的正則表達式(例如在高級搜索對話框中)則務(wù)必使用該參數(shù)以防止一些惡意的正則表達式導(dǎo)致無限計算。
編譯正則表達式
RegexOptions.Compiled 選項將會使 Regex 實例通過輕量級的代碼生成器動態(tài)地構(gòu)建并編譯針對特定正則表達式的代碼,提高匹配速度。
模式修正符
模式修正符不僅可以打開,還可以關(guān)閉。如下示例,先打開忽略大小寫,再關(guān)閉忽略大小寫,所以匹配結(jié)果是 Aa 。
Regex.Match("AAAa", "(?i)a(?-i)a").Value; // Aa
零寬斷言
現(xiàn)在要寫一個用于驗證密碼是否符合要求的正則表達式,要求是至少包含一個數(shù)字。
這個很簡單,如下就可以了
Regex.IsMatch("12345678", "\d");
現(xiàn)在加一個條件,長度要大于 6 位。似乎用一個正則無法實現(xiàn)。
其實是可以的,用零寬斷言中的 正向先行斷言 就可以了。
正向先行斷言 (?=exp) ,一般用來匹配 exp 之前的內(nèi)容。例如下面?zhèn)€例子,要取出姓名,需要匹配 , 之前的內(nèi)容。
Regex.Match("姓名張三,男,30 歲", "(?<=姓名).*?(?=,)").Value; // 張三
其實,正確的理解是:正向先行斷言,匹配成功之后,會退回起始位置,然后繼續(xù)之后的匹配。
這里最重要的一點是,匹配成功以后退回起始位置,所以,對它正確的理解是,一個前向條件判斷。
那么上面的密碼至少包含一個數(shù)字,且長度大于 6 就好實現(xiàn)了:
Regex.IsMatch("abcde6", @"(?=.*\d).{6,}");
我們再增加一點難度,密碼要求符合如下條件:
- 至少 8 位
- 至少包含一個數(shù)字
- 至少包含一個小寫字母
- 至少包含一個大寫字母
string pattern = @"(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,}";
Regex.IsMatch("12345678", pattern); // false
Regex.IsMatch("1234567a", pattern); // false
Regex.IsMatch("123456aA", pattern); // true
分割字符串
分割字符串分隔符不會包含在結(jié)果中,若要將分隔符包含在結(jié)果中,則可以將表達式包含在正前向條件中。
foreach (string s in Regex.Split("oneTwoThree", "(?=[A-Z])"))
Console.WriteLine(s);
// one
// Two
// Three
分組
正則表達式中可以通過 \n 語法來引用索引為 n 的分組。
var m = Regex.Matches("pop pope peep", @"\b(\w)\w+\1\b");
// pop
// peep
命名捕獲分組語法:
(?'組名'表達式) 或 (?<組名>表達式)
引用命名分組語法:
\k'組名' 或 \k<組名>
替換并分割文本
替換字符串可以通過 $0 作為替代結(jié)構(gòu)訪問原始的匹配。$1 、$2 訪問任意捕獲的分組。對于命名分組,可以通過 ${name} 的方式進行訪問。
給所有數(shù)字加上 <>:
Console.WriteLine(Regex.Replace("1 + 11 = 12", @"\d+", @"<$0>"));
// <1> + <11> = <12>
MatchEvaluator 委托
Replace 方法有一個重載,使用 MatchEvaluator 委托作為參數(shù),替代 replacement 。該委托將對每個匹配執(zhí)行一次,并使用其返回結(jié)果替換原字符串中的值。
MatchEvaluator 委托定義:
public delegate string MatchEvaluator(Match match);
示例:
Console.WriteLine(Regex.Replace("1 + 11 = 12", @"\d+", m => (int.Parse(m.Value) * 10).ToString()));
// 10 + 110 = 120
|