论一只爬虫的自我修养5:正则表达式 – 零基础入门学习Python057

论一只爬虫的自我修养5:正则表达式

 

让编程改变世界

Change the world by program


 

正则表达式

 

如果大家课后有勤加练习,那么对于字符串查找,你应该已经是深恶痛绝了。你发现下载一个网页是容易滴,但是要在网页中找到你需要的内容,那是困难。你发现字符串查找并不是那么简单,并不是直接使用 find() 方法找到匹配的字符串位置就可以了。

 

关于正则表达式,有一个非常经典的美式笑话——有些人面临一个问题的时候会想:“我知道,可以使用正则表达式来解决这个问题。”于是,现在他就有两个问题了。有些鱼油可能没懂,意思就是使用正则表达式,本身就是一个难题。 没错,正则表达式的确很难学,但却非常有用。

 

这么说吧,在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要。用 Python 自带的字符串方法,你一定会恼羞成怒。这时候,如果你懂得正则表达式,你会发现这真是灵丹妙药,因为正则表达式就是用于描述这些复杂规则的工具。

 

不同的语言均有使用正则表达式的方法,但各不相同。Python 的话呢,是通过re模块来实现的。接下来,我们边写例子边给大家讲解,这样比较容易消化:

…… 此处省略N多内容,具体请看视频讲解 ……


为您推荐

报歉!评论已关闭.