文字範囲

文字範囲 R は、指定した範囲の Universal Character Set (UCS) コードポイントを持つすべての XML 文字を含む文字セット C(R) を識別します。

構文

charRange ::= seRange | XmlCharRef | XmlCharIncDash

seRange ::= charOrEsc '-' charOrEsc

XmlCharRef ::= ( '&#' [0-9]+ ';' ) | ('&#x' [0-9a-fA-F]+ ';' )

charOrEsc ::= XmlChar | SingleCharEsc

XmlChar ::= [^\#x2D#x5B#x5D]

XmlCharIncDash ::= [^\#x5B#x5D]

単一の XML 文字は、その XML 文字だけを含む文字セットを識別する文字範囲です。すべての XML 文字は、次の場合を除き、有効な文字範囲です。

文字範囲を s-e の形式で記述して、UCS コードポイントが s 以上で e 以下のすべての XML 文字を含むセットを識別することもできます。

s-e の形式は、次の場合に有効な文字範囲です。

s が単一文字エスケープ、つまり XML 文字のとき。
s が "\" 以外のとき。
s が文字クラス式内の先頭文字であり、s が "^" ではないとき。
e が単一文字エスケープまたは XML 文字のとき。
e が "\" または "[;" 以外のとき。
コードポイント e が、コードポイント s より大きいかまたは等しいとき。

注意

単一文字エスケープのコードポイントは、その単一文字エスケープによって識別される、文字セット内の単一の文字のコードポイントです。