REGEXP 是什么(WIP)

正则表达式 Regular Expression (缩写为 REGEXP)是一种用于匹配字符串的强大工具,它可以用几个简单的符号来描述规则,以实现匹配符合相应规则的文本。 正则表达式的概念在计算机科学领域得到了广泛的应用,它被用于文本处理、搜索和替换等方面,在许多文本编辑器和编程语言中都可以看见它的身影(正则表达式这个概念最初就是由 Unix 的工具软件 grep 普及的1)。

它的起源可以追溯到20世纪50年代,当时美国数学家斯蒂芬·科尔尼(Stephen Cole Kleene发明了一种用于描述有限自动机的符号系统,这种符号系统后来被称为正则表达式。(可以理解成,为了用计算机处理字符串,搞了个这个东西提高效率)

正则表达式的语法和规则并不是很复杂,但是由于它的灵活性和强大的功能,使得它在实际应用中往往显得有些晦涩难懂(一大堆数学符号的组合,一开始可能看不懂)。但是,一旦掌握了正则表达式的基本语法和规则,它就会成为你处理文本和数据的得力助手。

译名问题

正则表达式用简单字符串来描述、匹配文中全部匹配指定格式的字符串。因此,这种描述字符串规律的表达式理应翻译为规则表达式(Pattern Expression),由于翻译讲究信达雅,所以人们更习惯称之为正则表达式(简中地区)或者規則運算式(繁中地区)。

基本语法

Footnotes

  1. 维基百科:正则表达式