Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!

A UTF-8 01000001
A UTF-16 00000000 01000001
A UTF-32 00000000 00000000 00000000 01000001
あ UTF-8 11100011 10000001 10000010
あ UTF-16 00110000 01000010
あ UTF-32 00000000 00000000 00110000 01000010
0xxx xxxx — один110x xxxx — два1110 xxxx — три10xx xxxx, поэтому разрыв потока грозит потерей максимум одного символа.Characters are an abstraction. A string is a sequence of those abstractions.
Символы — это абстракция. А строки — это последовательность таких абстракций.
string <=> bytes.
Что нужно знать каждому разработчику о кодировках и наборах символов для работы с текстом