Spec-Zone .ru
спецификации, руководства, описания, API
Содержание документации

Поддерживаемые Кодировки

java.io.InputStreamReader, java.io.OutputStreamWriter, java.lang.String классы, и классы в java.nio.charset пакет может преобразовать между Unicode и многими другими кодировками символов. Поддерживаемые кодировки изменяются между различными реализациями Платформы Java, Standard Edition 7 (Java SE 7). Описание класса для java.nio.charset.Charset перечисляет кодировки, которые любая реализация Платформы Java, Standard Edition 7 обязана поддерживать.

Java Oracle Комплект разработчика 7 SE (Java SE 7) для всех платформ (Солярис, Linux, и Microsoft Windows) и Java Среда выполнения SE 7 (JRE 7) для Соляриса и Linux поддерживает все кодировки, показанные на этой странице. JRE Oracle 7 для Microsoft Windows может быть установлен как полная международная версия или как европейская версия языков. По умолчанию, JRE 7 установок установщика европейская версия языков, если это распознает, что операционная система узла только поддерживает европейские языки. Если установщик распознает, что любой другой язык необходим, или если пользователь запрашивает поддержку неевропейских языков в специализированной установке, полная международная версия устанавливается. Европейская версия языков только поддерживает кодировки, показанные в следующем Основном Кодировании стол, на Который накрывают. Международная версия (который включает файл lib/charsets.jar) поддерживает все кодировки, показанные на этой странице.

Следующие таблицы показывают наборы кодирования, поддерживаемые Java SE 7. Канонические имена используются новым java.nio API являются во многих случаях не тем же самым как используемыми в java.io и java.lang API.

Основной Набор Кодирования (содержавшийся в lib/rt.jar)

Каноническое имя для java.nio API

Каноническое имя для java.io API и java.lang API

Описание

IBM00858

Cp858

Разновидность Cp850 с Европейским символом

IBM437

Cp437

MS-DOS Соединенные Штаты, Австралия, Новая Зеландия, Южная Африка

IBM775

Cp775

Балтийский PC

IBM850

Cp850

Латынь MS-DOS 1

IBM852

Cp852

Латынь MS-DOS 2

IBM855

Cp855

IBM Cyrillic

IBM857

Cp857

IBM Turkish

IBM862

Cp862

Еврей PC

IBM866

Cp866

Русский MS-DOS

ISO-8859-1

ISO8859_1

ISO-8859-1, латинский Алфавит № 1

ISO-8859-2

ISO8859_2

Латинский Алфавит № 2

ISO-8859-4

ISO8859_4

Латинский Алфавит № 4

ISO-8859-5

ISO8859_5

Латынь/Кириллица

ISO-8859-7

ISO8859_7

Латинский/Греческий Алфавит (ISO-8859-7:2003)

ISO-8859-9

ISO8859_9

Латинский Алфавит № 5

ISO-8859-13

ISO8859_13

Латинский Алфавит № 7

ISO-8859-15

ISO8859_15

Латинский Алфавит № 9

KOI8-R

KOI8_R

KOI8-R, русский язык

KOI8-U

KOI8_U

KOI8-U, украинский язык

US-ASCII

ASCII

Стандартный американский код обмена информацией

UTF-8

UTF8

Восьмиразрядный Unicode (или UCS) Формат Преобразования

UTF-16

UTF-16

Шестнадцатиразрядный Unicode (или UCS) Формат Преобразования, порядок байтов идентифицируется дополнительной меткой порядка байтов

UTF-16BE

UnicodeBigUnmarked

Шестнадцатиразрядный Unicode (или UCS) Формат Преобразования, обратный порядок байтов

UTF-16LE

UnicodeLittleUnmarked

Шестнадцатиразрядный Unicode (или UCS) Формат Преобразования, прямой порядок байтов

UTF-32

UTF_32

32-разрядный Unicode (или UCS) Формат Преобразования, порядок байтов идентифицируется дополнительной меткой порядка байтов

UTF-32BE

UTF_32BE

32-разрядный Unicode (или UCS) Формат Преобразования, обратный порядок байтов

UTF-32LE

UTF_32LE

32-разрядный Unicode (или UCS) Формат Преобразования, прямой порядок байтов

x-UTF-32BE-BOM

UTF_32BE_BOM

32-разрядный Unicode (или UCS) Формат Преобразования, обратный порядок байтов, с меткой порядка байтов

x-UTF-32LE-BOM

UTF_32LE_BOM

32-разрядный Unicode (или UCS) Формат Преобразования, прямой порядок байтов, с меткой порядка байтов

окна 1250

Cp1250

Житель восточной Европы Windows

окна 1251

Cp1251

Кириллица Windows

окна 1252

Cp1252

Латынь Windows 1

окна 1253

Cp1253

Грек Windows

окна 1254

Cp1254

Турецкий язык Windows

окна 1257

Cp1257

Балтийский Windows

Не доступный

UnicodeBig

Шестнадцатиразрядный Unicode (или UCS) Формат Преобразования, обратный порядок байтов, с меткой порядка байтов

x-IBM737

Cp737

Грек PC

x-IBM874

Cp874

Таец IBM

x-UTF-16LE-BOM

UnicodeLittle

Шестнадцатиразрядный Unicode (или UCS) Формат Преобразования, прямой порядок байтов, с меткой порядка байтов

 

Расширенный Набор Кодирования (содержавшийся в lib/charsets.jar)

Каноническое имя для java.nio API

Каноническое имя для java.io API и java.lang API

Описание

Big5

Big5

Big5, Традиционные китайцы

Big5-HKSCS

Big5_HKSCS

Big5 с Гонконгскими расширениями, Традиционные китайцы (соединяющаяся версия 2001 года)

EUC-JP

EUC_JP

JISX 0201, 0208 и 0212, EUC кодирование японского языка

EUC-КРИПТОН

EUC_KR

KS C 5601, кодирование EUC, корейский язык

GB18030

GB18030

Упрощенный китайский, стандарт PRC

GB2312

EUC_CN

GB2312, кодирование EUC, Упрощенный китайский

GBK

GBK

GBK, Упрощенный китайский

Тайский IBM

Cp838

IBM Thailand расширяла SBCS

IBM01140

Cp1140

Разновидность Cp037 с Европейским символом

IBM01141

Cp1141

Разновидность Cp273 с Европейским символом

IBM01142

Cp1142

Разновидность Cp277 с Европейским символом

IBM01143

Cp1143

Разновидность Cp278 с Европейским символом

IBM01144

Cp1144

Разновидность Cp280 с Европейским символом

IBM01145

Cp1145

Разновидность Cp284 с Европейским символом

IBM01146

Cp1146

Разновидность Cp285 с Европейским символом

IBM01147

Cp1147

Разновидность Cp297 с Европейским символом

IBM01148

Cp1148

Разновидность Cp500 с Европейским символом

IBM01149

Cp1149

Разновидность Cp871 с Европейским символом

IBM037

Cp037

США, Канада (Двуязычный, французский), Нидерланды, Португалия, Бразилия, Австралия

IBM1026

Cp1026

IBM Latin 5, Турция

IBM1047

Cp1047

Латинский 1 набор символов для узлов EBCDIC

IBM273

Cp273

IBM Austria, Германия

IBM277

Cp277

IBM Denmark, Норвегия

IBM278

Cp278

IBM Finland, Швеция

IBM280

Cp280

IBM Italy

IBM284

Cp284

Каталонец/Испания IBM, испанская Латинская Америка

IBM285

Cp285

IBM United Kingdom, Ирландия

IBM297

Cp297

IBM France

IBM420

Cp420

Арабский язык IBM

IBM424

Cp424

Еврей IBM

IBM500

Cp500

EBCDIC 500V1

IBM860

Cp860

Португалец MS-DOS

IBM861

Cp861

Исландский язык MS-DOS

IBM863

Cp863

Канадский французский язык MS-DOS

IBM864

Cp864

Арабский язык PC

IBM865

Cp865

Скандинав MS-DOS

IBM868

Cp868

MS-DOS Пакистан

IBM869

Cp869

Грек IBM Modern

IBM870

Cp870

IBM Multilingual Latin 2

IBM871

Cp871

IBM Iceland

IBM918

Cp918

IBM Pakistan (урду)

ISO-2022-CN

ISO2022CN

GB2312 и CNS11643 в ISO 2022 форма CN, Упрощенные и Традиционные китайцы (преобразование в Unicode только)

ISO-2022-JP

ISO2022JP

JIS X 0201, 0208, в форме ISO 2022, японском языке

ISO-2022-KR

ISO2022KR

ISO 2022 КРИПТОНА, корейский язык

ISO-8859-3

ISO8859_3

Латинский Алфавит № 3

ISO-8859-6

ISO8859_6

Латинский/Арабский Алфавит

ISO-8859-8

ISO8859_8

Латинский/Еврейский Алфавит

JIS_X0201

JIS_X0201

JIS X 0201

JIS_X0212-1990

JIS_X0212-1990

JIS X 0212

Shift_JIS

SJIS

Shift-JIS, японский язык

ЭТО 620

TIS620

TIS620, тайский язык

окна 1255

Cp1255

Еврей Windows

окна 1256

Cp1256

Арабский язык Windows

окна 1258

Cp1258

Вьетнамец Windows

окна-31j

MS932

Японец Windows

x-Big5-Solaris

Big5_Solaris

Big5 с семью дополнительными отображениями символа идеограммы Hanzi для Соляриса zh_TW.BIG5 локаль

x-euc-jp-linux

EUC_JP_LINUX

JISX 0201, 0208, EUC кодирование японского языка

x-EUC-TW

EUC_TW

CNS11643 (Плоскость 1-7,15), кодирование EUC, Традиционные китайцы

x-eucJP-Open

EUC_JP_Solaris

JISX 0201, 0208, 0212, EUC кодирование японского языка

x-IBM1006

Cp1006

IBM AIX Pakistan (урду)

x-IBM1025

Cp1025

IBM Multilingual Cyrillic: Болгария, Босния, Herzegovinia, Македония (FYR)

x-IBM1046

Cp1046

Арабский язык IBM - Windows

x-IBM1097

Cp1097

IBM Iran (фарси) / персидский язык

x-IBM1098

Cp1098

IBM Iran (фарси) / персидский язык (PC)

x-IBM1112

Cp1112

IBM Latvia, Литва

x-IBM1122

Cp1122

IBM Estonia

x-IBM1123

Cp1123

IBM Ukraine

x-IBM1124

Cp1124

IBM AIX Ukraine

x-IBM1381

Cp1381

IBM OS/2, ДУШ Пеопле'с Републик оф Чина (PRC)

x-IBM1383

Cp1383

IBM AIX People's Republic of China (PRC)

x-IBM33722

Cp33722

IBM-eucJP - японский язык (надмножество 5050)

x-IBM834

Cp834

Кореец IBM EBCDIC DBCS-only

x-IBM856

Cp856

Еврей IBM

x-IBM875

Cp875

Грек IBM

x-IBM921

Cp921

IBM Latvia, Литва (AIX, DOS)

x-IBM922

Cp922

IBM Estonia (AIX, DOS)

x-IBM930

Cp930

Японское Katakana-кандзи, смешанное с 4370 UDC, надмножеством 5026

x-IBM933

Cp933

Корейский язык, Смешанный с 1880 UDC, надмножеством 5029

x-IBM935

Cp935

Узел Упрощенного китайского, смешанный с 1880 UDC, надмножеством 5031

x-IBM937

Cp937

Традиционный китайский Узел miexed с 6204 UDC, надмножеством 5033

x-IBM939

Cp939

Японское латинское Кандзи, смешанное с 4370 UDC, надмножеством 5035

x-IBM942

Cp942

IBM OS/2 Japanese, надмножество Cp932

x-IBM942C

Cp942C

Разновидность Cp942

x-IBM943

Cp943

IBM OS/2 Japanese, надмножество Cp932 и Shift-JIS

x-IBM943C

Cp943C

Разновидность Cp943

x-IBM948

Cp948

Китаец ОС/2 (Тайвань) надмножество 938

x-IBM949

Cp949

Кореец PC

x-IBM949C

Cp949C

Разновидность Cp949

x-IBM950

Cp950

Китаец PC (Гонконг, Тайвань)

x-IBM964

Cp964

Китаец AIX (Тайвань)

x-IBM970

Cp970

Кореец AIX

x-ISCII91

ISCII91

Кодирование ISCII91 Относящихся к Индии сценариев

x-ISO2022-CN-CNS

ISO2022_CN_CNS

CNS11643 в ISO 2022 форма CN, Традиционные китайцы (преобразование из Unicode только)

x-ISO2022-CN-GB

ISO2022_CN_GB

GB2312 в ISO 2022 форма CN, Упрощенный китайский (преобразование из Unicode только)

x-iso-8859-11

x-iso-8859-11

Латинский/Тайский Алфавит

x-JIS0208

x-JIS0208

JIS X 0208

x-JISAutoDetect

JISAutoDetect

Обнаруживает и преобразовывает из Shift-JIS, EUC-JP, ISO 2022 JP (преобразование в Unicode только)

x-Johab

x-Johab

Корейский язык, набор символов Johab

x-MacArabic

Макарабик

Арабский язык Macintosh

x-MacCentralEurope

Максентрэлеуроуп

Латынь Macintosh 2

x-MacCroatian

Маккроутиэн

Хорват Macintosh

x-MacCyrillic

Маккириллик

Кириллица Macintosh

x-MacDingbat

Макдингбэт

Графическая метка Macintosh

x-MacGreek

Макгрик

Грек Macintosh

x-MacHebrew

Макхебрю

Еврей Macintosh

x-MacIceland

Макиселэнд

Macintosh Исландия

x-макрочеловек

Макрочеловек

Римлянин Macintosh

x-макромания

Макромания

Macintosh Румыния

x-MacSymbol

Максимбол

Символ Macintosh

x-MacThai

Мактай

Таец Macintosh

x-MacTurkish

Мактеркиш

Турецкий язык Macintosh

x-MacUkraine

Макукрэйн

Macintosh Украина

x-MS950-HKSCS

MS950_HKSCS

Windows Традиционные китайцы с Гонконгскими расширениями

x-mswin-936

MS936

Упрощенный китайский Windows

x-PCK

PCK

Версия Соляриса Shift_JIS

x-SJIS_0213

x-SJIS_0213

Shift_JISX0213

x окна 50220

Cp50220

Кодовая страница 50220 Windows (7-разрядная реализация)

x окна 50221

Cp50221

Кодовая страница 50221 Windows (7-разрядная реализация)

x окна 874

MS874

Таец Windows

x окна 949

MS949

Кореец Windows

x окна 950

MS950

Windows Традиционные китайцы

x-windows-iso2022jp

x-windows-iso2022jp

Различный ISO-2022-JP (базируемый MS932)


Oracle и/или его филиалы Авторское право © 1993, 2011, Oracle и/или его филиалы. Все права защищены.
Свяжитесь с Нами