Satimage 戻る| 次へ
表現をRegularに誘導してください。
オートメーション環境 > Text、ユニコードレッジ(exp)、およびXML > Textが捜して、取り替える ホームページ > 情報センター > Onlineドキュメンテーション >-- Regular表現 ツへの正規表現 >ガイド?/長さ>
目次
検索パターンを定義します。 最初に戻る
  • 正規表現を使用するのは第一に、検索ストリングとして特別なストリングを渡す際に成ります。 文字どおりの意味の代わりに、その特別なストリングは捜し求められるパターンを定義します。

  • 正規表現検索パターンで使用されると、ほとんどのキャラクタが彼らの文字どおりの意味を仮定します、そして、いくつかのキャラクタが特別な役割を果たします: 以下でこのセクションで説明されたメタキャラクタ。

  • AppleScriptコンパイラが、バックスラッシュが \と二重引用文であると考える、 特殊文字として:、」 あなたはバックスラッシュでそれらから「逃げなければなりません」。 このようにして: 「「\」」はあなたがどう 」 二重引用文、および\\を入力するかということです。」 バックスラッシュのために、あります。

メタキャラクタと「エスケープ」キャラクタ 最初に戻る
  • 例えば、ブラケット [)は文字どおりの意味を回復して、 \例えば、 [a-z] \[[0-9]\]がそうするバックスラッシュでそれを前に置きます。メタキャラクタを持っている、( c[8]を合わせてください。

  • 他の場合では、あなたが以下を見るようにバックスラッシュがあるキャラクタはメタキャラクタです、キャラクタだけが文字どおりの意味を保ちますが。

  • 括弧(括弧はキャラクタのクラスを定義します、例えば [a-z]、以下を見る)で理解できないそれらのメタキャラクタは括弧で彼らの文字どおりの意味を回復します。 例えば、 [][\] 期間とバックスラッシュには、それぞれ立ってください。

  • バックスラッシュでバックスラッシュ自体から逃げて、文字どおりの意味を回復しなければなりません。 したがって、AppleScriptにおける正規表現でバックスラッシュを見つけるために、あなたは4つのバックスラッシュを書きます。

    regexpとの「\\があるエスケープ」の「テキストに」 \\\\を見つけてください」
    「\\があるエスケープ」の「テキストに」 \\を見つけてください」
アンカー 最初に戻る
あなたはテキストのいくつかの特定の種類の位置を表すタグとして以下のキャラクタを使用することができます。
  • 線の ^(帽子)始まり、窓での選択の始まり、または変数に格納されたテキストの始まり
  • 窓での選択、または変数に格納されたテキストの終わりの線の端、または端の $
中、「」 ^を変える」、「「regexpによる「どんなもそうしません」 --、「」、」
中、「$です」のために変化してください、「「regexpによる「どんなもそうしません」、」
-- 「あってください、」
これはデフォルトの振舞いです、また、上のタグの意味を変える旗の周りで以下を見てください。
  • 単語の \<始まり
  • >が終わらせる単語の\
  • 単語の \b始めか終わり
  • 厳密に単語の中の \B
「tobe」のregexpによる「テキスト」 \\bbeを見つけてください」
締め括りの言葉を合わせるでしょう。
文字クラス 最初に戻る
  • . (以上) CR(ASCII13)以外のどんなキャラクタのためのスタンド。
    regexpでテキスト「n(. *)」に「」コネを見つけてください。
    “not"から行の終わりを合わせるでしょう。
これがデフォルトの振舞いであり、また、旗の周りで下を見てください、どれ、許容. (以上) CR(ASCII13)を合わせるために。
  • [] 括弧はキャラクタのクラスのために定義を要約します。 例えば、 [0-9]はどんなケタにも合います。
  • - ハイフンのそれぞれの側で(ASCII注文を考える場合)キャラクタの中にあるキャラクタの範囲を定義して、例えば、52個の大文字していて小文字のローマ手紙のいずれも合わせます [a-zA-Z]
  • ^は、帽子キャラクタについて来るキャラクタを除くことによって、クラスを定義します。
    regexpとストリング結果がある" homer@lol.com "でテキストに「[^@]*」を見つけてください。
    -- 「ホームラン」
    (星 *の意味は以下で説明されます)
  • \wは単語で許容されているキャラクタのいずれでもあります。
  • \Wは単語区切り文字として許容されているキャラクタのいずれでもあります。
  • \r CR、復帰、ASCII13
  • \n LF、改行、ASCII10
  • \tタブ、ASCII9
  • [: alnum:] セット、ローマ手紙、およびケタを事前に定義しました。 括弧の中で要約される場合にだけ、事前に定義されたセットは働いています。 例えば、 ^[: alnum:]5@はまさに線の始めに見つけられて、"@"によって続かれた5つのアルファベット数字式キャラクタのセットに合うでしょう。
  • [: アルファ:] ローマ手紙
  • [: 下ろします:] 小文字のローマ手紙
  • [: 上側:] 大文字しているローマ手紙
  • [: ケタ:] ケタ
  • [: xdigit:] 16進数字(小文字で大文字する)です。
  • [: 空白:] スペースかタブ
  • [: スペース:] スペース、タブ、CR、LFまたはFF
  • [: cntrl:] ASCIIコード<32か=127があるキャラクタのセット
  • または、どちらの [: punct:]a制御文字、英数字
regexpとの窓1の選択における「--」への変化"^"
「」 ^[: スペース:]*を変えてください」、「「regexpとの窓1の選択」
それぞれテキストのブロックがアクティブウィンドウで選択したアウトと「非-コメント」について論評するでしょう。

文字通りでaを含んでいる、 ][]範囲では、それを最初に、リストに置いてください。

文字通りの ^を含むには、最初に、それをどこでも置いてください。

文字通りでaを含めてください --最後にそれを置いてください。

\w\Wは括弧 []だけの外におけるメタキャラクタであると考えられます。

\r\n、および \tは括弧とそれらがただバックスラッシュに従う時以外の括弧の外におけるメタキャラクタであると考えられます。

したがって、 rがあとに続いた(系列 \n\tを捜し求めるために)文字通りのバックスラッシュを合わせるには、バックスラッシュから逃げる追加バックスラッシュを挿入してください: \\rを捜し求めてください。

ユニコード文字クラス 最初に戻る
ユニコードにおける正規表現は3追加メタキャラクタ、 \u 円p、および 円のPを定義します。
  • そのキャラクタは、 \uがキャラクタの16進ユニコードで続いたと指定します。

    以下の例は与えられた公式の数学記号(0x22FFへのユニコード0×2200)を見つけます。 (AppleScriptソースのASCII制限のために、私たちはユニコードウィンドウにオリジナルのストリングを入れなければなりません。)

    ユニコードウィンドウ1のテキストにxを設定してください。
    ツ??i>--ツ?∀x|x∈[+ 0、∞]∃y、y∉Ω、∫y(x).dx≪ y∧、1インチ
    「[\\u2200-\\u22FF]」というxのregexpがあるufindテキスト、ストリング結果、およびすべての発生
    ツ??「i>--ツ?、」∀", "∈", "∞", "∃", "∉", "∫", "≪", "∧"}
  • いくらかの _が分類する\pといくらかの _が分類する\Pは当然のことのクラスのどんなキャラクタ、またはそれぞれ当然のことのクラスに属さないどんなキャラクタも指定します。

    何らかの _のクラスが、Categoryのための識別子かClassのための識別子であるかもしれません。

    窓2のテキストにxを設定してください。
    ツ??i>--ツ?χαμόγελο - 「Smileんでください--微笑」
    「ufindテキスト」\\pギリシアの+、」 regexpとのコネxとストリング結果
    ツ??i>--「χαμόγελο」
    「ufindテキスト」\\p CJKUnifiedIdeographs+、」 regexpとのコネxとストリング結果
    ツ??i>--「微笑」
  • Categoryのための識別子は以下です。
    C
    コントロール
    Zs
    空白
    Z
    WhitespaceAndNewline
    nd
    DecimalDigit
    L
    手紙
    Ll
    LowercaseLetter
    Lu
    UppercaseLetter
    M
    NonBase
    D
    Decomposable
    A
    英数字
    P
    句読
    不-
    不法入国者
    Lt
    CapitalizedLetter
  • Classのための識別子を別々のページに提供します。 以下では、新しい窓でClassesのリストを開くために、クリックします。
オペレータ 最初に戻る
  • *前のグループのゼロ発生、例えば、 ^[: スペース:]] *は線の始めに空間とタブのどんな組み合わせにも合うでしょう。
  • +1回以上の発生
  • ゼロか1回の 発生
  • i、j、j発生へのi、例えば、 2、4が望んでいる[0-9]は2ケタか3ケタか4ケタのグループに合います。
  • i、i発生か以上
  • i、i発生、ちょうど。
  • |、例えば、 始まります。|終わりは「始まってください」か「終わり」のどちらかに合うでしょう。
  • ([0-9] 例えば、3歳の ()グループキャラクタ、)、+は「1億2323万4345」に合うかもしれません。 また、後でそれらに参照をつけることができるようになりたがっているとき、あなたはグループを使用します:
  • \1, \2 ... 9円であることは、パターンの連続したグループの参照です。 検索ストリング自体、または 掘り出し物のテキスト、またはコネの 使用パラメタでそれらの参照を使用することができる、 変化のパラメタに。

    ^1(. *)\r(. *\r)*円の$が2つの同じ線の間で腕木を付けられた1ブロックのテキストに合うでしょう。 ゆったり過ごします:

    regexpが」 \\1インチを使用しているsomeTextの「テキストに」 r(. *\\r)*\\1^(. *)\円の$を見つけてください」
    同じパターンを合わせますが、写し線だけを返すでしょう。

    0円は全体のマッチを表します。

    グループの参照は 変化動詞に有用であるかもしれません。

    「変化、「([0-9]2)、/([0-9]2)、」、」 regexpとsomeTextの\2円/\\1インチ
    例えば、変化する、「「12/25インチ」への25/12インチ

    グループの注文は初めの括弧の注文です。 何らかのグループがパターンで繰り返されるなら、それは最終的に最後の発生を表します。

    regexp、すべての発生、およびストリング結果がある「「(^|[^0-9) (([0-9] 1、3円の\。)3[0-9]1、3)」というtheText使用における掘り出し物のテキスト」\\2インチ
    theTextで見つけられたすべての点を打たされた数値IPアドレスのリストを返すでしょう(ストリングとして)。

    regexp、すべての発生、およびストリング結果がある「「(^|[^0-9) (([0-9] 1、3円の\。)3[0-9]1、3)」というtheText使用における掘り出し物のテキスト」\\3インチ
    theTextで見つけられた点を打たされた数値IPアドレスの3番目のバイトのリストを返すでしょう(ストリングがドットで続いたので)。

最初に戻る
Satimage osaxの辞書は、正規表現が3個の旗を支えると述べます: 「広げられた」 「ニューライン。」 スクリプトから旗を使用することができるだけです。 デフォルトで(その結果 Findパネルで)、以下の旗は設定されます: 「広げられた」「ニューライン。」
  • 「広げられる」: デフォルトで、セットします。 メタキャラクタが基本的なものの代わりに設定する拡張POSIXを使用するために、命令します。 基本的なメタキャラクタセットは ()を含んでいません。|, または、+. 変数を含んでいる正規表現を使用しているなら、あなたは「 拡張した」旗を損傷したがっているかもしれません: このように、Regular表現を混乱させないで、変数はそれらのキャラクタを含むかもしれません。
  • 「ニューライン」: デフォルトで、セットします。 各線が別々の記録であるとみなすために、命令します。 すなわち、期間. どんなマッチにもCRをしないで、^ $ 合うアンカーに行の始めと終わりをします。 「ニューライン」であるなら、旗は設定されません、期間。マッチCR、およびアンカー ^$がテキストの始めと終わりに合うだけでありますように。

    「ニューライン」旗の身体障害者と共に実行された検索は、その旗で実行された検索がセットするより指数の量のメモリを必要とするかもしれなくて、その結果、失敗に傾向があるかもしれません。

掘り出し物のテキスト変化または re_コンパイルコマンドに regexpflagパラメタを使用すると、あなたは旗のリスト、または空のリストを提供します。 リストに属すそれらの旗が設定されるでしょう、リストが入れてあないそれらの旗はそれとなくunsetになるでしょうが。
regexpがある「終わり」、リターン、および「終わり」regexpflag"EXTENDED"でテキスト「終わりの$」を見つけてください。
「ニューライン」旗が設定されないので、2番目の単語だけを合わせるでしょう。
aを定義して、パターンを取り替えてください。 最初に戻る
または、ストリングを取り替えてください、 Findパネルに入られるように 変化動詞の議論に、以下のメタキャラクタを含めることができます : \0, \1 ... 9円(検索パターンで 0円定義されるところで全体のマッチについて言及するグループの参照)と特殊文字 \r\n、および \t

同じキャラクタは 掘り出し物のテキスト使用議論として渡されたストリングで有効です。 掘り出し物のテキスト使用議論はストリングのストリングとリストを支えます--すべてのストリングが、メタキャラクタがすぐ上にリストアップされたと認めます。

テキストに「ミッキーマウス」使用における「(. +)(. +)」を見つけてください、「Dest: \\2インチさん、「親愛な\、1円、」、regexpとストリング結果、」
戻る| 次へ
Copyright(C)2004パリ、Satimage