Spec-Zone .ru
спецификации, руководства, описания, API
|
java.io.InputStreamReader
, java.io.OutputStreamWriter
, java.lang.String
классы, и классы в java.nio.charset
пакет может преобразовать между Unicode и многими другими кодировками символов. Поддерживаемые кодировки изменяются между различными реализациями Платформы Java, Standard Edition 7 (Java SE 7). Описание class для java.nio.charset.Charset
перечисляет кодировки, которые любая реализация Платформы Java, Standard Edition 7 обязана поддерживать.
Java Oracle Комплект разработчика 7 SE (Java SE 7) для всех платформ (Солярис, Linux, и Microsoft Windows) и Java Среда выполнения SE 7 (JRE 7) для Соляриса и Linux поддерживает все кодировки, показанные на этой странице. JRE Oracle 7 для Microsoft Windows может быть установлен как полная международная версия или как европейская версия языков. По умолчанию, JRE 7 установок установщика европейская версия языков, если это распознает, что операционная система узла только поддерживает европейские языки. Если установщик распознает, что любой другой язык необходим, или если пользователь запрашивает поддержку неевропейских языков в специализированной установке, полная международная версия устанавливается. Европейская версия языков только поддерживает кодировки, показанные в следующем Основном Кодировании стол, на Который накрывают. Международная версия (который включает файл lib/charsets.jar) поддерживает все кодировки, показанные на этой странице.
Следующие таблицы показывают наборы кодирования, поддерживаемые Java SE 7. Канонические имена используются новым java.nio
API являются во многих случаях не тем же самым как используемыми в java.io
и java.lang
API.
Каноническое имя для |
Каноническое имя для |
Описание |
---|---|---|
IBM00858 |
Cp858 |
Разновидность Cp850 с Европейским символом |
IBM437 |
Cp437 |
MS-DOS Соединенные Штаты, Австралия, Новая Зеландия, Южная Африка |
IBM775 |
Cp775 |
Балтийский PC |
IBM850 |
Cp850 |
Латынь MS-DOS 1 |
IBM852 |
Cp852 |
Латынь MS-DOS 2 |
IBM855 |
Cp855 |
IBM Cyrillic |
IBM857 |
Cp857 |
IBM Turkish |
IBM862 |
Cp862 |
Еврей PC |
IBM866 |
Cp866 |
Русский MS-DOS |
ISO-8859-1 |
ISO8859_1 |
ISO-8859-1, латинский Алфавит № 1 |
ISO-8859-2 |
ISO8859_2 |
Латинский Алфавит № 2 |
ISO-8859-4 |
ISO8859_4 |
Латинский Алфавит № 4 |
ISO-8859-5 |
ISO8859_5 |
Латынь/Кириллица |
ISO-8859-7 |
ISO8859_7 |
Латинский/Греческий Алфавит (ISO-8859-7:2003) |
ISO-8859-9 |
ISO8859_9 |
Латинский Алфавит № 5 |
ISO-8859-13 |
ISO8859_13 |
Латинский Алфавит № 7 |
ISO-8859-15 |
ISO8859_15 |
Латинский Алфавит № 9 |
KOI8-R |
KOI8_R |
KOI8-R, русский язык |
KOI8-U |
KOI8_U |
KOI8-U, украинский язык |
US-ASCII |
ASCII |
Стандартный американский код обмена информацией |
UTF-8 |
UTF8 |
Восьмиразрядный Unicode (или UCS) Формат Преобразования |
UTF-16 |
UTF-16 |
Шестнадцатиразрядный Unicode (или UCS) Формат Преобразования, порядок байтов идентифицируется дополнительной меткой порядка байтов |
UTF-16BE |
UnicodeBigUnmarked |
Шестнадцатиразрядный Unicode (или UCS) Формат Преобразования, обратный порядок байтов |
UTF-16LE |
UnicodeLittleUnmarked |
Шестнадцатиразрядный Unicode (или UCS) Формат Преобразования, прямой порядок байтов |
UTF-32 |
UTF_32 |
32-разрядный Unicode (или UCS) Формат Преобразования, порядок байтов идентифицируется дополнительной меткой порядка байтов |
UTF-32BE |
UTF_32BE |
32-разрядный Unicode (или UCS) Формат Преобразования, обратный порядок байтов |
UTF-32LE |
UTF_32LE |
32-разрядный Unicode (или UCS) Формат Преобразования, прямой порядок байтов |
x-UTF-32BE-BOM |
UTF_32BE_BOM |
32-разрядный Unicode (или UCS) Формат Преобразования, обратный порядок байтов, с меткой порядка байтов |
x-UTF-32LE-BOM |
UTF_32LE_BOM |
32-разрядный Unicode (или UCS) Формат Преобразования, прямой порядок байтов, с меткой порядка байтов |
окна 1250 |
Cp1250 |
Житель восточной Европы Windows |
окна 1251 |
Cp1251 |
Кириллица Windows |
окна 1252 |
Cp1252 |
Латынь Windows 1 |
окна 1253 |
Cp1253 |
Грек Windows |
окна 1254 |
Cp1254 |
Турецкий язык Windows |
окна 1257 |
Cp1257 |
Балтийский Windows |
Не доступный |
UnicodeBig |
Шестнадцатиразрядный Unicode (или UCS) Формат Преобразования, обратный порядок байтов, с меткой порядка байтов |
x-IBM737 |
Cp737 |
Грек PC |
x-IBM874 |
Cp874 |
Таец IBM |
x-UTF-16LE-BOM |
UnicodeLittle |
Шестнадцатиразрядный Unicode (или UCS) Формат Преобразования, прямой порядок байтов, с меткой порядка байтов |
Каноническое имя для |
Каноническое имя для |
Описание |
---|---|---|
Big5 |
Big5 |
Big5, Традиционные китайцы |
Big5-HKSCS |
Big5_HKSCS |
Big5 с Гонконгскими расширениями, Традиционные китайцы (соединяющаяся версия 2001 года) |
EUC-JP |
EUC_JP |
JISX 0201, 0208 и 0212, EUC кодирование японского языка |
EUC-КРИПТОН |
EUC_KR |
KS C 5601, кодирование EUC, корейский язык |
GB18030 |
GB18030 |
Упрощенный китайский, стандарт PRC |
GB2312 |
EUC_CN |
GB2312, кодирование EUC, Упрощенный китайский |
GBK |
GBK |
GBK, Упрощенный китайский |
Тайский IBM |
Cp838 |
IBM Thailand расширяла SBCS |
IBM01140 |
Cp1140 |
Разновидность Cp037 с Европейским символом |
IBM01141 |
Cp1141 |
Разновидность Cp273 с Европейским символом |
IBM01142 |
Cp1142 |
Разновидность Cp277 с Европейским символом |
IBM01143 |
Cp1143 |
Разновидность Cp278 с Европейским символом |
IBM01144 |
Cp1144 |
Разновидность Cp280 с Европейским символом |
IBM01145 |
Cp1145 |
Разновидность Cp284 с Европейским символом |
IBM01146 |
Cp1146 |
Разновидность Cp285 с Европейским символом |
IBM01147 |
Cp1147 |
Разновидность Cp297 с Европейским символом |
IBM01148 |
Cp1148 |
Разновидность Cp500 с Европейским символом |
IBM01149 |
Cp1149 |
Разновидность Cp871 с Европейским символом |
IBM037 |
Cp037 |
США, Канада (Двуязычный, французский), Нидерланды, Португалия, Бразилия, Австралия |
IBM1026 |
Cp1026 |
IBM Latin 5, Турция |
IBM1047 |
Cp1047 |
Латинский 1 набор символов для узлов EBCDIC |
IBM273 |
Cp273 |
IBM Austria, Германия |
IBM277 |
Cp277 |
IBM Denmark, Норвегия |
IBM278 |
Cp278 |
IBM Finland, Швеция |
IBM280 |
Cp280 |
IBM Italy |
IBM284 |
Cp284 |
Каталонец/Испания IBM, испанская Латинская Америка |
IBM285 |
Cp285 |
IBM United Kingdom, Ирландия |
IBM297 |
Cp297 |
IBM France |
IBM420 |
Cp420 |
Арабский язык IBM |
IBM424 |
Cp424 |
Еврей IBM |
IBM500 |
Cp500 |
EBCDIC 500V1 |
IBM860 |
Cp860 |
Португалец MS-DOS |
IBM861 |
Cp861 |
Исландский язык MS-DOS |
IBM863 |
Cp863 |
Канадский французский язык MS-DOS |
IBM864 |
Cp864 |
Арабский язык PC |
IBM865 |
Cp865 |
Скандинав MS-DOS |
IBM868 |
Cp868 |
MS-DOS Пакистан |
IBM869 |
Cp869 |
Грек IBM Modern |
IBM870 |
Cp870 |
IBM Multilingual Latin 2 |
IBM871 |
Cp871 |
IBM Iceland |
IBM918 |
Cp918 |
IBM Pakistan (урду) |
ISO-2022-CN |
ISO2022CN |
GB2312 и CNS11643 в ISO 2022 форма CN, Упрощенные и Традиционные китайцы (преобразование в Unicode только) |
ISO-2022-JP |
ISO2022JP |
JIS X 0201, 0208, в форме ISO 2022, японском языке |
ISO-2022-KR |
ISO2022KR |
ISO 2022 КРИПТОНА, корейский язык |
ISO-8859-3 |
ISO8859_3 |
Латинский Алфавит № 3 |
ISO-8859-6 |
ISO8859_6 |
Латинский/Арабский Алфавит |
ISO-8859-8 |
ISO8859_8 |
Латинский/Еврейский Алфавит |
JIS_X0201 |
JIS_X0201 |
JIS X 0201 |
JIS_X0212-1990 |
JIS_X0212-1990 |
JIS X 0212 |
Shift_JIS |
SJIS |
Shift-JIS, японский язык |
TI 620 |
TIS620 |
TIS620, тайский язык |
окна 1255 |
Cp1255 |
Еврей Windows |
окна 1256 |
Cp1256 |
Арабский язык Windows |
окна 1258 |
Cp1258 |
Вьетнамец Windows |
окна-31j |
MS932 |
Японец Windows |
x-Big5-Solaris |
Big5_Solaris |
Big5 с семью дополнительными отображениями символа идеограммы Hanzi для Соляриса zh_TW.BIG5 локаль |
x-euc-jp-linux |
EUC_JP_LINUX |
JISX 0201, 0208, EUC кодирование японского языка |
x-EUC-TW |
EUC_TW |
CNS11643 (Плоскость 1-7,15), кодирование EUC, Традиционные китайцы |
x-eucJP-Open |
EUC_JP_Solaris |
JISX 0201, 0208, 0212, EUC кодирование японского языка |
x-IBM1006 |
Cp1006 |
IBM AIX Pakistan (урду) |
x-IBM1025 |
Cp1025 |
IBM Multilingual Cyrillic: Болгария, Босния, Herzegovinia, Македония (FYR) |
x-IBM1046 |
Cp1046 |
Арабский язык IBM - Windows |
x-IBM1097 |
Cp1097 |
IBM Iran (фарси) / персидский язык |
x-IBM1098 |
Cp1098 |
IBM Iran (фарси) / персидский язык (PC) |
x-IBM1112 |
Cp1112 |
IBM Latvia, Литва |
x-IBM1122 |
Cp1122 |
IBM Estonia |
x-IBM1123 |
Cp1123 |
IBM Ukraine |
x-IBM1124 |
Cp1124 |
IBM AIX Ukraine |
x-IBM1381 |
Cp1381 |
IBM OS/2, ДУШ Пеопле'с Републик оф Чина (PRC) |
x-IBM1383 |
Cp1383 |
IBM AIX People's Republic of China (PRC) |
x-IBM33722 |
Cp33722 |
IBM-eucJP - японский язык (надмножество 5050) |
x-IBM834 |
Cp834 |
Кореец IBM EBCDIC DBCS-only |
x-IBM856 |
Cp856 |
Еврей IBM |
x-IBM875 |
Cp875 |
Грек IBM |
x-IBM921 |
Cp921 |
IBM Latvia, Литва (AIX, DOS) |
x-IBM922 |
Cp922 |
IBM Estonia (AIX, DOS) |
x-IBM930 |
Cp930 |
Японское Katakana-кандзи, смешанное с 4370 UDC, надмножеством 5026 |
x-IBM933 |
Cp933 |
Корейский язык, Смешанный с 1880 UDC, надмножеством 5029 |
x-IBM935 |
Cp935 |
Узел Упрощенного китайского, смешанный с 1880 UDC, надмножеством 5031 |
x-IBM937 |
Cp937 |
Традиционный китайский Узел miexed с 6204 UDC, надмножеством 5033 |
x-IBM939 |
Cp939 |
Японское латинское Кандзи, смешанное с 4370 UDC, надмножеством 5035 |
x-IBM942 |
Cp942 |
IBM OS/2 Japanese, надмножество Cp932 |
x-IBM942C |
Cp942C |
Разновидность Cp942 |
x-IBM943 |
Cp943 |
IBM OS/2 Japanese, надмножество Cp932 и Shift-JIS |
x-IBM943C |
Cp943C |
Разновидность Cp943 |
x-IBM948 |
Cp948 |
Китаец ОС/2 (Тайвань) надмножество 938 |
x-IBM949 |
Cp949 |
Кореец PC |
x-IBM949C |
Cp949C |
Разновидность Cp949 |
x-IBM950 |
Cp950 |
Китаец PC (Гонконг, Тайвань) |
x-IBM964 |
Cp964 |
Китаец AIX (Тайвань) |
x-IBM970 |
Cp970 |
Кореец AIX |
x-ISCII91 |
ISCII91 |
Кодирование ISCII91 Относящихся к Индии сценариев |
x-ISO2022-CN-CNS |
ISO2022_CN_CNS |
CNS11643 в ISO 2022 форма CN, Традиционные китайцы (преобразование из Unicode только) |
x-ISO2022-CN-GB |
ISO2022_CN_GB |
GB2312 в ISO 2022 форма CN, Упрощенный китайский (преобразование из Unicode только) |
x-iso-8859-11 |
x-iso-8859-11 |
Латинский/Тайский Алфавит |
x-JIS0208 |
x-JIS0208 |
JIS X 0208 |
x-JISAutoDetect |
JISAutoDetect |
Обнаруживает и преобразовывает из Shift-JIS, EUC-JP, ISO 2022 JP (преобразование в Unicode только) |
x-Johab |
x-Johab |
Корейский язык, набор символов Johab |
x-MacArabic |
Макарабик |
Арабский язык Macintosh |
x-MacCentralEurope |
Максентрэлеуроуп |
Латынь Macintosh 2 |
x-MacCroatian |
Маккроутиэн |
Хорват Macintosh |
x-MacCyrillic |
Маккириллик |
Кириллица Macintosh |
x-MacDingbat |
Макдингбэт |
Графическая метка Macintosh |
x-MacGreek |
Макгрик |
Грек Macintosh |
x-MacHebrew |
Макхебрю |
Еврей Macintosh |
x-MacIceland |
Макиселэнд |
Macintosh Исландия |
x-макрочеловек |
Макрочеловек |
Римлянин Macintosh |
x-макромания |
Макромания |
Macintosh Румыния |
x-MacSymbol |
Максимбол |
Символ Macintosh |
x-MacThai |
Мактай |
Таец Macintosh |
x-MacTurkish |
Мактеркиш |
Турецкий язык Macintosh |
x-MacUkraine |
Макукрэйн |
Macintosh Украина |
x-MS950-HKSCS |
MS950_HKSCS |
Windows Традиционные китайцы с Гонконгскими расширениями |
x-mswin-936 |
MS936 |
Упрощенный китайский Windows |
x-PCK |
PCK |
Версия Соляриса Shift_JIS |
x-SJIS_0213 |
x-SJIS_0213 |
Shift_JISX0213 |
x окна 50220 |
Cp50220 |
Кодовая страница 50220 Windows (7-разрядная реализация) |
x окна 50221 |
Cp50221 |
Кодовая страница 50221 Windows (7-разрядная реализация) |
x окна 874 |
MS874 |
Таец Windows |
x окна 949 |
MS949 |
Кореец Windows |
x окна 950 |
MS950 |
Windows Традиционные китайцы |
x-windows-iso2022jp |
x-windows-iso2022jp |
Различный ISO-2022-JP (базируемый MS932) |