Unicodeコード空間は、0から16までの17のプレーンに分割されています。BMPのすべてのコードポイントは、UTF-16エンコーディングで単一コード単位としてアクセスされ、UTF-8で1,2,3バイトでエンコードできます。プレーン1〜16(補足プレーン)のコードポイントは、UTF-16のサロゲートペアとしてアクセスされ、UTF-8の4バイトでエンコードされます。各平面内で、文字は関連する文字の名前付きブロック内に割り当てられます。ブロックは任意のサイズですが、常に16コードポイントの倍数であり、しばしば128コードポイントの倍数です。特定のスクリプトに必要な文字は、いくつかの異なるブロックに分散されている可能性があります。
|