文字範囲 R は、指定した範囲の Universal Character Set (UCS) コード ポイントを持つすべての XML 文字を含む文字セット C(R) を識別します。
構文
charRange ::= seRange | XmlCharRef | XmlCharIncDash
構文
seRange ::= charOrEsc '-' charOrEsc
構文
XmlCharRef ::= ( '&#' [0-9]+ ';' ) | ('&#x' [0-9a-fA-F]+ ';' )
構文
charOrEsc ::= XmlChar | SingleCharEsc
構文
XmlChar ::= [^\#x2D#x5B#x5D]
構文
XmlCharIncDash ::= [^\#x5B#x5D]
解説
単一の XML 文字は、その XML 文字だけを含む文字セットを識別する文字範囲です。すべての XML 文字は、次の場合を除き、有効な文字範囲です。
左角かっこ ([)、右角かっこ (])、および円記号 (\) の文字範囲は、有効な文字範囲ではありません。
キャレット (^) は、正の文字グループが負の文字グループの一部であるときにだけ、正の文字グループの先頭の有効な文字範囲となります。
減算文字 (-) は、正の文字グループの先頭または末尾でだけ有効な文字範囲です。
文字範囲を s-e の形式で記述して、UCS コード ポイントが s 以上で e 以下のすべての XML 文字を含むセットを識別することもできます。
s-e の形式は、次の場合に有効な文字範囲です。
s が単一文字エスケープ、つまり XML 文字のとき。
s が "\" 以外のとき。
s が文字クラス式内の先頭文字であり、s が "^" ではないとき。
e が単一文字エスケープまたは XML 文字のとき。
e が "\" または "[;" 以外のとき。
コード ポイント e が、コード ポイント s より大きいかまたは等しいとき。
注意
単一文字エスケープのコード ポイントは、その単一文字エスケープによって識別される、文字セット内の単一の文字のコード ポイントです。
参照
リファレンス
XML スキーマの正規表現
XML スキーマ正規表現参照チャート
負の文字グループ
正の文字グループ