ラベル 正規表現 の投稿を表示しています。 すべての投稿を表示

正規表現 の 実行エンジン

今回は「正規表現 の 実行エンジン」についてまとめます。 目次 実行エンジンの種類 実行エンジンの基本原則 NFA 実行エンジンの動作 実行エンジンの種類 正規表現の実行エンジンには大きく以下の2種類が存在します。 DFA (決定性有限オートマトン。Deterministic Finite Automaton。) NFA (非決定性有限オートマトン。Nondeterministic Finite Automation。) 以下でそれぞれについて特徴と実装しているプログラムを見ていきます。 主な特徴 DFA DFAは、文字列を走査中に現在可能性のあるすべてのマッチを管理しながら合致する文字列を探していきます。 その仕組みは「文字列を軸にマッチする文字列を探す」ものに ...

正規表現 記法 まとめ

今回は O'Reilly の「正規表現」をもとに「一般的な正規表現の使い方」についてまとめます。 さまざまな言語を集約すると「一般的に正規表現ではこんなものが使えるよ」といったまとめになっています。 なので、言語やフレームワーク、利用するツールによって使える機能や使い方が微妙に異なるので、具体的なものは各リファレンスを参照してください。 目次 単一文字 ドット 文字クラス 文字クラスの略記 エスケープ文字 Unicode文字プロパティ キャプチャ グループ化して後方参照 グループ化のみ 名前付き ...

よく使う 正規表現 の テンプレート集

よく利用されるであろう 正規表現 の サンプル を集めてみました。 目次 URL メールアドレス 電話番号 郵便番号 日付 (W3C-DTF) ファイルパス / フォルダパス URL 簡易 実質的によく利用される文字列のみで構成されるような URL のみを許可する正規表現です。 https?://[\w\-\.~#\$&\+\/:=\?%]+ 自由なスキーマ スキーマを特定せず、利用できる文字も RFC 3986 に従った正規表現です。 URL の構成は考慮していないので、文字が配置される場所が不適切でも一致します。 [\w\+\-\.]+://[\w\-\.~!#\$&'\(\)\*\+,\/:;=\?@\[\]%]+ メールアドレス 一般的なメールアドレスとして成り立っているかどうか簡易的なチ ...