Unicode
110110xx yyyyyyyy U+D800〜U+DBFF サロゲートペア上位 110111xx yyyyyyyy U+DC00〜U+DFFF サロゲートペア下位 11111110 11111111 U+FEFF バイト順マーク (BOM) なお、U+FFFEはBOM誤判定用に予約されており、UTF-16でも定義されない。
110110xx yyyyyyyy U+D800〜U+DBFF サロゲートペア上位 110111xx yyyyyyyy U+DC00〜U+DFFF サロゲートペア下位 11111110 11111111 U+FEFF バイト順マーク (BOM) なお、U+FFFEはBOM誤判定用に予約されており、UTF-16でも定義されない。