第1课:简介与字母表基础

正则表达式(regular expression,常简写为regex、regexp或RE)在从文本中提取信息时非常有用,比如代码、日志文件、电子表格。尽管形式语言(formal language)背后涉及很多计算机理论,本教程重点介绍正则表达式的实用用法,以便能过解决实际问题。

在使用正则表达式时,首先要认识到的一点是:一切本质上都是字符。我们编写的是匹配特定字符序列的模式(pattern)。大多数模式使用的是普通的 ASCII 字符,包括字母、数字、标点符号以及键盘上的其他符号(如 %#$@!),当然也可以使用 Unicode 字符来匹配文本。

下面有几行示例文本,你会发现,当你在下方的输入框中输入内容时,每一行中匹配的字符会高亮显示。要进入下一课,你需要使用本课中介绍的新语法和概念,编写一个能匹配所有提供行的正则表达式。

现在就试试看,写一个可以匹配这三行文本的模式:也许只需要找出每行中共有的字母就可以了

练习 1: 匹配字符串
Task Text  
匹配 abcdefg To be completed
匹配 abcde To be completed
匹配 abc To be completed
提示

因为每个字符串中都包含abc,尝试输入前三个字母 abc以匹配所有字符串。

解决上面的问题以继续到, 或者可以参考答案