/UTF-16

Z Brain-wiki

TI:WTBD/UTF-16

Reprezentacja ciągu znaków z Unicode w postaci ciągu słów 16-bitowych, taka że wszystkie punkty kodowe z BMP (w granicach wartości 16-bitowych) są reprezentowane przez słowa o wartości numerycznej równej wartości odp. kodów, a punkty kodowe ponad 0xFFFF (spoza BMP) reprezentowane są przez tzw. //pary surogatów//. Dość sprytny algorytm opisany jest tu, korzysta on z faktu pozostawienia przedziału wartości zastrzeżonych (bez przydzielonych znaków) w zakresie 0xD800 .. 0xFFFF.

UTF-16 znajduje spore zastosowanie w praktyce. Pewne trudności powoduje fakt, że słowa 16-bitowe mogą być składane z bajtów albo stawiając najpierw bajt ,,starszy" (big-endian), albo najpierw ,,młodszy" (little-endian). Stąd wziął się tzw. Byte Order Mark.