在Java中,我們?yōu)榱瞬檎夷硞€(gè)給定字符串中是否有需要查找的某個(gè)字符或者子字串、或者對(duì)字符串進(jìn)行分割、或者對(duì)字符串一些字符進(jìn)行替換/刪除,一般會(huì)通過if-else、for 的配合使用來實(shí)現(xiàn)這些功能 。如下所示:
- public class Test{
- public static void main(String args[]) {
- String str="@Shang Hai Hong Qiao Fei Ji Chang";
- boolean rs = false;
- for(int i=0;i<str.length();i++){
- char z=str.charAt(i);
- if('a' == z || 'F' == z) {
- rs = true;
- break;
- }else{
- rs= false;
- }
- }
- System.out.println(rs);
- }
- }
這種方法使用簡單直觀,但是 難以解決復(fù)雜的工作,而且代碼量也會(huì)增加很多,不利于維護(hù)。
這時(shí),我們可以使用正則表達(dá)式來實(shí)現(xiàn)這些功能,而且代碼簡單易維護(hù)。下面就來介紹了Java中對(duì)字符串的正則表達(dá)式的幾個(gè)常用的功能,具體情況如下所示(其中用到了java.util.regex包):
1.Java中在某個(gè)字符串中查詢某個(gè)字符或者某個(gè)子字串
- String s = "@Shang Hai Hong Qiao Fei Ji Chang";
- String regEx = "a|F"; //表示a或F
- Pattern pat = Pattern.compile(regEx);
- Matcher mat = pat.matcher(s);
- boolean rs = mat.find();
如果s中有regEx,那么rs為true,否則為flase。
如果想在查找時(shí)忽略大小寫,則可以寫成Pattern pat=Pattern.compile(regEx,Pattern.CASE_INSENSITIVE);
2.在某個(gè)文件中獲取一段字符串
- String regEx = ".+\(.+)$";
- String s = "c:\test.txt";
- Pattern pat = Pattern.compile(regEx);
- Matcher mat = pat.matcher(s);
- boolean rs = mat.find();
- for(int i=1;i<=mat.groupCount();i++){
- System.out.println(mat.group(i));
- }
以上的執(zhí)行結(jié)果為test.txt,提取的字符串儲(chǔ)存在mat.group(i)中,其中i最大值為mat.groupCount();
3.對(duì)字符串的分割
- String regEx=":";
- Pattern pat = Pattern.compile(regEx);
- String[] rs = pat.split("aa:bb:cc");
執(zhí)行后,r就是{"aa","bb","cc"}
如果用正則表達(dá)式分割就如上所示,一般我們都會(huì)使用下面更簡單的方法:
- String s = "aa:bb:cc";
- String[] rs=s.split(":");
4.字符串的替換/刪除
- String regEx="@+"; //表示一個(gè)或多個(gè)@
- Pattern pat=Pattern.compile(regEx);
- Matcher mat=pat.matcher("@@aa@b cc@@");
- String s=mat.replaceAll("#");
結(jié)果為"##aa#b cc##" 如果要把字符串中的@都給刪除,只用要空字符串替換就可以了:
- String s=mat.replaceAll("");
結(jié)果為"aab cc"
注:對(duì)Pattern類的說明: 1.public final class java.util.regex.Pattern是正則表達(dá)式編譯后的表達(dá)法。
下面的語句將創(chuàng)建一個(gè)Pattern對(duì)象并賦值給句柄pat:Pattern pat = Pattern.compile(regEx); 有趣的是,Pattern類是final類,而且它的構(gòu)造器是private。也許有人告訴你一些設(shè)計(jì)模式的東西,或者你自己查有關(guān)資料。這里的結(jié)論是:Pattern類不能被繼承,我們不能通過new創(chuàng)建Pattern類的對(duì)象。 因此在Pattern類中,提供了2個(gè)重載的靜態(tài)方法,其返回值是Pattern對(duì)象(的引用)。如:
- public static Pattern compile(String regex) {
- return new Pattern(regex, 0);
- }
當(dāng)然,我們可以聲明Pattern類的句柄,如Pattern pat = null;
2.pat.matcher(str)表示以用Pattern去生成一個(gè)字符串str的匹配器,它的返回值是一個(gè)Matcher類的引用。 我們可以簡單的使用如下方法:boolean rs = Pattern.compile(regEx).matcher(str).find();
|
附 : 常用的正則表達(dá)式:
匹配特定數(shù)字: ^[1-9]d*$ //匹配正整數(shù) ^-[1-9]d*$ //匹配負(fù)整數(shù) ^-?[1-9]d*$ //匹配整數(shù) ^[1-9]d*|0$ //匹配非負(fù)整數(shù)(正整數(shù) + 0) ^-[1-9]d*|0$ //匹配非正整數(shù)(負(fù)整數(shù) + 0) ^[1-9]d*.d*|0.d*[1-9]d*$ //匹配正浮點(diǎn)數(shù) ^-([1-9]d*.d*|0.d*[1-9]d*)$ //匹配負(fù)浮點(diǎn)數(shù) ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$ //匹配浮點(diǎn)數(shù) ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$ //匹配非負(fù)浮點(diǎn)數(shù)(正浮點(diǎn)數(shù) + 0) ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$ //匹配非正浮點(diǎn)數(shù)(負(fù)浮點(diǎn)數(shù) + 0) 評(píng)注:處理大量數(shù)據(jù)時(shí)有用,具體應(yīng)用時(shí)注意修正
匹配特定字符串: ^[A-Za-z]+$ //匹配由26個(gè)英文字母組成的字符串 ^[A-Z]+$ //匹配由26個(gè)英文字母的大寫組成的字符串 ^[a-z]+$ //匹配由26個(gè)英文字母的小寫組成的字符串 ^[A-Za-z0-9]+$ //匹配由數(shù)字和26個(gè)英文字母組成的字符串 ^w+$ //匹配由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串
在使用RegularExpressionValidator驗(yàn)證控件時(shí)的驗(yàn)證功能及其驗(yàn)證表達(dá)式介紹如下:
只能輸入數(shù)字:“^[0-9]*$” 只能輸入n位的數(shù)字:“^d{n}$” 只能輸入至少n位數(shù)字:“^d{n,}$” 只能輸入m-n位的數(shù)字:“^d{m,n}$” 只能輸入零和非零開頭的數(shù)字:“^(0|[1-9][0-9]*)$” 只能輸入有兩位小數(shù)的正實(shí)數(shù):“^[0-9]+(.[0-9]{2})?$” 只能輸入有1-3位小數(shù)的正實(shí)數(shù):“^[0-9]+(.[0-9]{1,3})?$” 只能輸入非零的正整數(shù):“^+?[1-9][0-9]*$” 只能輸入非零的負(fù)整數(shù):“^-[1-9][0-9]*$” 只能輸入長度為3的字符:“^.{3}$” 只能輸入由26個(gè)英文字母組成的字符串:“^[A-Za-z]+$” 只能輸入由26個(gè)大寫英文字母組成的字符串:“^[A-Z]+$” 只能輸入由26個(gè)小寫英文字母組成的字符串:“^[a-z]+$” 只能輸入由數(shù)字和26個(gè)英文字母組成的字符串:“^[A-Za-z0-9]+$” 只能輸入由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串:“^w+$” 驗(yàn)證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式為:以字母開頭,長度在6-18之間,
只能包含字符、數(shù)字和下劃線。 驗(yàn)證是否含有^%&’,;=?$”等字符:“[^%&’,;=?$x22]+” 只能輸入漢字:“^[u4e00-u9fa5],{0,}$” 驗(yàn)證Email地址:“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$” 驗(yàn)證InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$” 驗(yàn)證電話號(hào)碼:“^((d{3,4})|d{3,4}-)?d{7,8}$”
正確格式為:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”,
“XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。 驗(yàn)證身份證號(hào)(15位或18位數(shù)字):“^d{15}|d{}18$” 驗(yàn)證一年的12個(gè)月:“^(0?[1-9]|1[0-2])$”正確格式為:“01”-“09”和“1”“12” 驗(yàn)證一個(gè)月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”
正確格式為:“01”“09”和“1”“31”。
匹配中文字符的正則表達(dá)式: [u4e00-u9fa5] 匹配雙字節(jié)字符(包括漢字在內(nèi)):[^x00-xff] 匹配空行的正則表達(dá)式:n[s| ]*r 匹配HTML標(biāo)記的正則表達(dá)式:/< (.*)>.*|< (.*) />/ 匹配首尾空格的正則表達(dá)式:(^s*)|(s*$) 匹配Email地址的正則表達(dá)式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 匹配網(wǎng)址URL的正則表達(dá)式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?
|
|