第1课:认识了解正则表达式
我们先来看一下什么是正则表达式
简单的理解,它是一门功能强大的文本处理语言,相对传统文本处理的4大优势
1.灵活
2.高效
3.强大
4.便捷
一个正则表达式,就是用某种模式去匹配一类字符串的一个公式。不懂正则表达式的朋友看到这个公式,可能就像看天书一样,看上去比较古怪而且复杂,所以不敢去使用.举个例子
接下来我们现在来对比一下 正则的代码和传统的代码 之间的区别
第2课:点号应用之简单的数据提取
这里给大家整理了一些常用的正则表达式的字符表
本节课我们将接触点号(  .),利用点匹配我们想要的数据并提取出来
.        可以匹配任何一个单字符,除换行符外
1个点号只能匹配字符,如 123456789abcde….等,必须为半角的
如果,想要匹配全半数字,字母,或汉字,就必须要2个点号

第3课:星号的认识与应用
*        星号        表示之前的元素出现任意次数或0次
比如:4.*8 我们来看一下他是什么意思,星号出现在点号的后面,这代表点号有出现也行,没有出现也行;
打个比方,他可以匹配 48、41238、412345678、4012345670123458

第4课:问号和加号的认识与应用
?        问号        表示前面元素出现0次或1次
+        加号        表示前面元素必须出现1次或1次以上
第5课:连字符和范围描述符的认识与应用
在学习”-”连字符前,我们先来认识一个强大的符号:[  ],这个 [  ]所括的内容,可以不按顺序进行匹配。
[ ]        范围描述符        范围描述符。如:[a-z]表示从a到z之间的任意一个。
-        连字符                一般都与”[ ]”一起使用,只有连字符在字符组内部时,并且出现在两个字符之间时,才能表示字符的范围;如果出现在字符组的开头,则只能表示连字符本身
例如:
[0-9]   匹配任意0到9的数字
[a-z]   匹配所有小写字母
[A-Z]  匹配所有大写字母
当然,你可以把它们混在一起写成[a-z0-9]、[0-9a-zA-z]的样子都可以
下面我们举2个例子就明白了
从一个网页源码中,区分出数字并提取出来

第6课:脱字符和美元符的认识与应用
^        脱字符        表示行的开头。
$        美元符        表示行的结尾。


注意:^在字符组的头部,将转换成排除型字符
[^1-9] 匹配除了1-9的数字,其它的可以匹配

第7课:转义符的认识与应用
\        转义符        作用:把正则的元字符转换成元字符本身
如果需要匹配的某个字符本身就是元字符(如:.?*+),正则表达式将如何处理呢?
比如:我想要检索互联网的主机名,也就是我们说的网址,如:www.23.com
我们的正则语句要怎么写呢?
想的快的会员就会说,我直接就用www.23.com来匹
配,点号可以匹配任何字符,包括点号本身,当然,这样是可以匹配到。但是,如果有
www123.com
www223.com        它们同样也会被匹配出来,唯一的解决办法就是把点号用转义符转
换成他自身。
\元字符本身
\.        \?        \*

第8课:字符组简记法1
>字符组简记法
1、对于常用的字符组,正则表达式提供了相应的简记法,能够方便的表示它们,并让我们更容易的记住他们
2、\d   = [0-9]                匹配0-9的任何数字
3、\D  = [^0-9]        不匹配0-9的任何数字
4、\w  = [0-9a-zA-z_]                匹配0-9和a-z的任何大小写字母
5,\W = [^0-9a-zA-z_]                不匹配0-9和a-z的任何大小写字母


只匹配数字和字母

第9课:字符组简记法2
字符组简记法2
\s         [\t\n\r\f]空字符
\t                制表符
\n                换行符
\r                回车符
\f                换页符
\S         非空字符
\b        单词边界符,表示为单词的分界符
\B        非单词边界符

第10课:大括号与选择符的认识与应用
大括号
|                选择符
{n}                前面的元素字符出现了n次
{n,}                前面的元素字符最少出现n次,n次以上
{m,n}                前面的元素最少出现m次,最多出现n次

第11课:子表达式的认识与应用
( )                 群组,分组,常用叫作子表达式


什么是子表达式?
在表达式中,以( )2个小括号括起来的,我们称其为子表达式
例如: 我们上节课讲到的   \d{3,4}[-|\s]?(\d{7,8})


子表达式的理解
我们现在利用1个树形框来理解他


注意:
子表达式的顺序是从左到右计算,以左括号”(”为标准
例如: \d{3,4}([-|\s]?(\d{7,8}))

第12课:贪婪和懒惰的匹配
1、什么是贪婪匹配?
从字面上我们可以理解为贪心,不知足,不满足。有多少要多少,在正则里面也一样。如: .* .+ {n,}
2、什么是懒惰匹配?
*?                 重复任意次,但尽可能少重复
+?                 重复1次或更多次,但尽可能少重复
??                 重复0次或1次,但尽可能少重复
{n,m}?         重复n到m次,但尽可能少重复
{n,}?                 重复n次以上,但尽可能少重复
3、从现在开始,每节课都会带有一个操作实例
我们这节课的实例为匹配出 百度MP3页面的全部歌曲。

下载地址1:
查看当前『隐藏内容』需花费 60资源豆,【支付查看