我们先来看一下什么是正则表达式
简单的理解,它是一门功能强大的文本处理语言,相对传统文本处理的4大优势
1.灵活
2.高效
3.强大
4.便捷
一个正则表达式,就是用某种模式去匹配一类字符串的一个公式。不懂正则表达式的朋友看到这个公式,可能就像看天书一样,看上去比较古怪而且复杂,所以不敢去使用.举个例子
接下来我们现在来对比一下 正则的代码和传统的代码 之间的区别
第2课:点号应用之简单的数据提取
这里给大家整理了一些常用的正则表达式的字符表
本节课我们将接触点号( .),利用点匹配我们想要的数据并提取出来
. 可以匹配任何一个单字符,除换行符外
1个点号只能匹配字符,如 123456789abcde….等,必须为半角的
如果,想要匹配全半数字,字母,或汉字,就必须要2个点号
第3课:星号的认识与应用
* 星号 表示之前的元素出现任意次数或0次
比如:4.*8 我们来看一下他是什么意思,星号出现在点号的后面,这代表点号有出现也行,没有出现也行;
打个比方,他可以匹配 48、41238、412345678、4012345670123458
第4课:问号和加号的认识与应用
? 问号 表示前面元素出现0次或1次
+ 加号 表示前面元素必须出现1次或1次以上
第5课:连字符和范围描述符的认识与应用
在学习”-”连字符前,我们先来认识一个强大的符号:[ ],这个 [ ]所括的内容,可以不按顺序进行匹配。
[ ] 范围描述符 范围描述符。如:[a-z]表示从a到z之间的任意一个。
- 连字符 一般都与”[ ]”一起使用,只有连字符在字符组内部时,并且出现在两个字符之间时,才能表示字符的范围;如果出现在字符组的开头,则只能表示连字符本身
例如:
[0-9] 匹配任意0到9的数字
[a-z] 匹配所有小写字母
[A-Z] 匹配所有大写字母
当然,你可以把它们混在一起写成[a-z0-9]、[0-9a-zA-z]的样子都可以
下面我们举2个例子就明白了
从一个网页源码中,区分出数字并提取出来
第6课:脱字符和美元符的认识与应用
^ 脱字符 表示行的开头。
$ 美元符 表示行的结尾。
注意:^在字符组的头部,将转换成排除型字符
[^1-9] 匹配除了1-9的数字,其它的可以匹配
第7课:转义符的认识与应用
\ 转义符 作用:把正则的元字符转换成元字符本身
如果需要匹配的某个字符本身就是元字符(如:.?*+),正则表达式将如何处理呢?
比如:我想要检索互联网的主机名,也就是我们说的网址,如:www.23.com
我们的正则语句要怎么写呢?
想的快的会员就会说,我直接就用www.23.com来匹
配,点号可以匹配任何字符,包括点号本身,当然,这样是可以匹配到。但是,如果有
www123.com
www223.com 它们同样也会被匹配出来,唯一的解决办法就是把点号用转义符转
换成他自身。
\元字符本身
\. \? \*
第8课:字符组简记法1
>字符组简记法
1、对于常用的字符组,正则表达式提供了相应的简记法,能够方便的表示它们,并让我们更容易的记住他们
2、\d = [0-9] 匹配0-9的任何数字
3、\D = [^0-9] 不匹配0-9的任何数字
4、\w = [0-9a-zA-z_] 匹配0-9和a-z的任何大小写字母
5,\W = [^0-9a-zA-z_] 不匹配0-9和a-z的任何大小写字母
只匹配数字和字母
第9课:字符组简记法2
字符组简记法2
\s [\t\n\r\f]空字符
\t 制表符
\n 换行符
\r 回车符
\f 换页符
\S 非空字符
\b 单词边界符,表示为单词的分界符
\B 非单词边界符
第10课:大括号与选择符的认识与应用
大括号
| 选择符
{n} 前面的元素字符出现了n次
{n,} 前面的元素字符最少出现n次,n次以上
{m,n} 前面的元素最少出现m次,最多出现n次
第11课:子表达式的认识与应用
( ) 群组,分组,常用叫作子表达式
什么是子表达式?
在表达式中,以( )2个小括号括起来的,我们称其为子表达式
例如: 我们上节课讲到的 \d{3,4}[-|\s]?(\d{7,8})
子表达式的理解
我们现在利用1个树形框来理解他
注意:
子表达式的顺序是从左到右计算,以左括号”(”为标准
例如: \d{3,4}([-|\s]?(\d{7,8}))
第12课:贪婪和懒惰的匹配
1、什么是贪婪匹配?
从字面上我们可以理解为贪心,不知足,不满足。有多少要多少,在正则里面也一样。如: .* .+ {n,}
2、什么是懒惰匹配?
*? 重复任意次,但尽可能少重复
+? 重复1次或更多次,但尽可能少重复
?? 重复0次或1次,但尽可能少重复
{n,m}? 重复n到m次,但尽可能少重复
{n,}? 重复n次以上,但尽可能少重复
3、从现在开始,每节课都会带有一个操作实例
我们这节课的实例为匹配出 百度MP3页面的全部歌曲。
下载地址1:
查看当前『隐藏内容』需花费 60资源豆,【支付查看】