-
java正则表达式提取字符串
一位以前的同事在群里面突然发了个需求,要通过正则表达式来取值,下面这篇文章主要给大家介绍了关于java如何用正则表达式匹配与提取字符串的相关资料,需要的朋友可以参考下
java.util.regex类支持用正则表达式来匹配和提取字符串,读者可以去官网查看java.util.regex的详细使用方法。
首先给出一个匹配字符串的例子(判断line是否符合格式"GraphType\\s*=\\s*\".+\"\\s*"):
1 2 3 4 5 6 |
public static boolean isLegalInputLine(String line ) { Pattern p =Pattern.compile( "GraphType\\s*=\\s*\".+\"\\s*" ); Matcher m = p.matcher(line); boolean r =m.matches(); return r; } |
这个函数判断line是否匹配格式"GraphType\\s*=\\s*\".+\"\\*",这里的格式是使用java的正则表达式语法规则书写的。具体的语法规则我提供一个网址:https://wenku.baidu.com/view/e109601f52d380eb62946d75.html?rec_flag=default&mark_pay_doc=2&mark_rec_page=1&mark_rec_position=4&mark_rec=view_r_1&clear_uda_param=1
里面有具体的介绍。
下面给出用正则表达式提取字符串的例子(从s中提取匹配格式"GraphType\\s*=\\s*\".+\"\\s*"的字符串):
1 2 3 4 5 6 7 8 9 10 |
public List<String> getString(String s) { List<String> strs = new ArrayList<String>(); Pattern p = Pattern.compile( "GraphType\\s*=\\s*\".+\"\\s*" ); Matcher m = p.matcher(s); while (m.find()) { strs.add(m.group()); } return strs; } |
有一款叫做Regex Match Tracer的软件,可以用它来练习书写java的正则表达式。值得注意的是这款软件匹配和提取字符串的结果和java中的有所不同,有时这块软件不能识别的,java可以识别,笔者就碰到过这种情况。
另外对于学过形式语言与自动机的要注意java的语法规则与形式语言与自动机里面的正则语法不同。
附:Java正则取出每一个匹配的字符串
1 2 3 4 5 6 7 8 |
String data = "我的1<if test='case == 1'>1</if>我的2<if test='case == 2'>2</if>" ; String regex = "<if test='([\\s\\S]*?)'>([\\s\\S]*?)</if>" ; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(data); while (matcher.find()) { String group = matcher.group(); System.out.println(group); } |