正規表現
正規表現(せいきひょうげん、regular expression)とは、文字列の集合を一つの文字列で表現する方法の一つである。正則表現(せいそくひょうげん)とも呼ばれ、形式言語理論の分野では比較的こちらの訳語の方が使われる。まれに正規式と呼ばれることもある。もともと正規表現は形式言語理論において正規言語を表すための手段として導入された。形式言語理論では、形式言語が正規言語であることと正規表現によって表せることは同値である。その後正規表現はテキストエディタワードプロセッサをはじめとするアプリケーションソフトパターンマッチ文字列を表すために使用されるようになり、表せるパターンの種類を増やすために本来の正規表現にはないさまざまな記法が新たに付け加えられた。このような拡張された正規表現には正規言語ではない文字列も表せるものも多く、ゆえに正規表現という名前は実態に即していない面もあるが、伝統的に正規表現と呼ばれ続けている。この記事では主にこのような正規表現を用いたパターンマッチについて説明している。以下、誤解のない限り、アプリケーションソフトやプログラミングにおいて正規表現を用いた文字列のパターンマッチを行う機能のことを、単に正規表現という。ほとんどのプログラミング言語では、構文またはライブラリによって正規表現を使うことができるようになっている。構文やライブラリに正規表現を備えたプログラミング言語やユーティリティとして、AWKSedPerlPythonRubyJavaJavaScriptPHPなどがある。また、プログラミング言語の開発などに用いるlexも正規表現を使う。それぞれの言語やアプリケーションで細部の仕様が異なっているが、POSIXにより標準規格も定められそれに準拠するものも増えてきてはいる。

1 基本的な概念
2 歴史
3 文法
 伝統的な UNIX の正規表現
 POSIX の拡張正規表現
 GNU Emacsの正規表現
 Perl の正規表現
4 正規表現ライブラリ
5 形式言語理論における正規表現
6 関連項目
7 参考文献
8 脚注
9 外部リンク