Java正则表达式

一、概念

正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成"regex",单数有regexp、regex,复数有regexps、regexes、regexen。

二、java正则表达式类

java.util.regex 包主要包括以下三个类:

Pattern 类:

pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。

Matcher 类:

Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。

PatternSyntaxException:

PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。

二、正则表达式的规则

  1. 任意一个字符表示匹配任意对应的字符,如a匹配a,7匹配7,-匹配-。

  2. []代表匹配中括号中其中任一个字符,如[abc]匹配a或b或c。

  3. -在中括号里面和外面代表含义不同,如在外时,就匹配-,如果在中括号内[a-b]表示匹配26个小写字母中的任一个;[a-zA-Z]匹配大小写共52个字母中任一个;[0-9]匹配十个数字中任一个。

  4. 在中括号里面和外面含义不同,如在外时,就表示开头,如7[0-9]表示匹配开头是7的,且第二位是任一数字的字符串;如果在中括号里面,表示除了这个字符之外的任意字符(包括数字,特殊字符),如[^abc]表示匹配出去abc之外的其他任一字符。

  5. .表示匹配任意的字符。

  6. \d表示数字。

  7. \D表示非数字。

  8. \s表示由空字符组成,[ \t\n\r\x\f]。

  9. \S表示由非空字符组成,[^\s]。

  10. \w表示字母、数字、下划线,[a-zA-Z0-9_]。

  11. \W表示不是由字母、数字、下划线组成。

  12. ?: 表示出现0次或1次。

  13. +表示出现1次或多次。

  14. *表示出现0次、1次或多次。

  15. 表示出现n次。

  16. {n,m}表示出现n~m次。

  17. {n,}表示出现n次或n次以上。

  18. XY表示X后面跟着Y,这里X和Y分别是正则表达式的一部分。

  19. X|Y表示X或Y,比如"food|f"匹配的是foo(d或f),而"(food)|f"匹配的是food或f。

  20. (X)子表达式,将X看做是一个整体。

二、Java中如何写正则表达式

在java中调用正则表达式的类是java.util.regex.Matcher和java.util.regex.Pattern,java.util.regex包是从jdk1.4开始提供的。有多种写法来使用正则表达式。

1. 匹配

1. 匹配一个数字。
public void regexTest1() {
        //要匹配的字符
        String str = "8";
        //正则表达式
        String regex = "[0-9]";
        //返回匹配的结果,匹配成功就返回true,失败就返回false,此次匹配返回true。
        boolean flag = Pattern.matches(regex, str);
        System.out.println(flag);
}
2. 匹配3个到5个字母,大小写不限,包括3和5个。
public void regexTest2() {
        //要匹配的字符
        String str = "yepk";
        //正则表达式
        String regex = "[a-zA-Z]{3,5}";
        //输出匹配的结果, 此次匹配返回true。
        System.out.println(str.matches(regex));
}
3. 匹配11位的电话号码

匹配规则:第一个数字是1,第二个数字是2,3,7,8中任一个,后面9位数字中不包含4。

public void regexTest3() {
	 //要匹配的字符
        String str = "13589262522";
        //正则表达式
        String regex = "1[3456789]\\d{9}";
        //将给定的正则表达式编译为模式。 如果匹配需求较多,且需用同相同的regex去匹配,就可将这句写到静态模块里面,用的时候直接使用实例p
        Pattern p = Pattern.compile(regex);
        //创建一个匹配器,匹配给定的输入与此模式。
        Matcher m = p.matcher(str);
        //尝试将整个区域与模式进行匹配。
        boolean flag = m.matches();
        //输出匹配结果,此次结果为true
        System.out.println(flag);
}

2. 替换

public void regexTest4() {
	 //要匹配的字符
        String str = "12a6B985Ccv65yepksxss";
        //正则表达式
        String regex = "[a-zA-Z]+";
        //正则表达式
        String regex2 = "\\d+";
        //将字符串中英文字母替换为&符号,输出12&6&985&65&
        System.out.println(str.replaceAll(regex, "&"));
        //将字符串中单个数字或者连续的数字替换为0,输出0a0B0Ccv0yepksxss
        System.out.println(str.replaceAll(regex2, "0"));
}

3. 切割,根据大写字母切割字符串。

public void regexTest5() {
	String str = "1A2B3C4D5";
        String regex = "[A-Z]";
        String[] arr = str.split(regex);
        for (String s : arr) {
            System.out.print(s + " ");
        }
	## 输出 1 2 3 4 5 
}
# java   code   正则表达式  

评论

企鹅群:39438021

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×