Unicode 文字データベースは General Category プロパティに対して可能な値を多く指定し、コード ポイントから特定の文字プロパティへのマッピングを提供します。次の表は、認識される General Category プロパティの値を指定したものです。
IsCategory
構文
IsCategory ::= Letters | Marks | Numbers | Punctuation | Separators | Symbols | Others
Letters
構文
Letters ::= 'L' [ultmo]?
次の表に、Letters のプロパティを示します。
プロパティ | 説明 |
---|---|
L |
すべての文字 |
Lu |
大文字 |
Ll |
小文字 |
Lt |
タイトル文字 |
Lm |
修飾子 |
Lo |
その他 |
Marks
構文
Marks ::= 'M' [nce]?
次の表に、Marks のプロパティを示します。
プロパティ | 説明 |
---|---|
M |
すべてのマーク |
Mn |
スペースなし |
Mc |
スペース結合 |
Me |
囲む |
Numbers
構文
Numbers ::= 'N' [dlo]?
次の表に、Numbers のプロパティを示します。
プロパティ | 説明 |
---|---|
N |
すべての数字 |
Nd |
10 進数字 |
Nl |
文字 |
No |
その他 |
Punctuation
構文
Punctuation ::= 'P' [cdseifo]?
次の表に、Punctuation のプロパティを示します。
プロパティ | 説明 |
---|---|
P |
すべての句読点 |
Pc |
コネクタ |
Pd |
ダッシュ |
Ps |
開く |
Pe |
Close |
Pi |
最初の引用符 (使用法によって Ps または Pe のように動作します) |
Pf |
最後の引用符 (使用法によって Ps または Pe のように動作します) |
Po |
その他 |
区切り文字
構文
Separators ::= 'Z' [slp]?
次の表に、Separators のプロパティを示します。
プロパティ | 説明 |
---|---|
Z |
すべての区切り文字 |
Zs |
スペース |
Zl |
行 |
Zp |
段落 |
シンボル
構文
Symbols ::= 'S' [mcko]?
次の表に、Symbols のプロパティを示します。
プロパティ | 説明 |
---|---|
S |
すべてのシンボル |
Sm |
数値演算 |
Sc |
通貨 |
Sk |
修飾子 |
So |
その他 |
その他
構文
Others ::= 'O' [cfon]?
次の表に、Others のプロパティを示します。
プロパティ | 説明 |
---|---|
O |
その他のすべて |
Cc |
コントロール |
Cf |
形式 |
Co |
個人用 |
Cn |
割り当てられていない文字 |
注意
Cs プロパティはここには含まれません。Cs プロパティは、XML インスタンス ドキュメントで使用される文字抽象化レベルでは発生しないサロゲート文字を識別します。
参照
リファレンス
XML スキーマの正規表現
XML スキーマ正規表現参照チャート