Spec-Zone .ru
спецификации, руководства, описания, API

10.1.10.5. utf8 Набор символов (3-байтовый UTF-8 UnicodeEncoding)

UTF-8 (Формат Преобразования Unicode с 8-разрядными модулями) является альтернативным способом хранить данные Unicode. Это реализуется согласно RFC 3629, который описывает последовательности кодирования, которые берут от одного до четырех байтов. (Более старый стандарт для кодирования UTF-8, RFC 2279, описывает последовательности UTF-8, которые берут от одного до шести байтов. RFC 3629 представляет устаревший RFC 2279; по этой причине последовательности с пятью и шестью байтами больше не используются.)

Идея UTF-8 состоит в том, что различные символы Unicode кодируются, используя последовательности байта различных длин:

utf8 набор символов является тем же самым в MySQL 5.6 как прежде 5.6 и имеет точно те же самые характеристики:

Точно тот же самый набор символов доступен в utf8 как в ucs2. Таким образом, у них есть тот же самый репертуар.