Spec-Zone .ru
спецификации, руководства, описания, API
|
public final class Character extends Object implements Serializable, Comparable<Character>
Character
class обертывает значение типа примитива char
в объекте. Объект типа Character
содержит единственное поле, тип которого char
. Кроме того, этот class обеспечивает несколько методов для того, чтобы они определили категорию символа (строчная буква, цифра, и т.д.) и для того, чтобы преобразовать символы от верхнего регистра до нижнего регистра и наоборот.
Символьная информация основана на Стандарте Unicode, версии 6.2.0.
Методы и данные class Character
определяются информацией в файле UnicodeData, который является частью Базы данных Символа Unicode, сохраняемой Консорциумом Unicode. Этот файл определяет различные свойства включая имя и общую категорию для каждой определенной кодовой точки Unicode или диапазона символов.
Файл и его описание доступны от Консорциума Unicode в:
char
тип данных (и поэтому значение это a Character
объект инкапсулирует), основаны на исходной спецификации Unicode, которая определила символы как фиксировано-width 16-разрядные объекты. Стандарт Unicode был с тех пор изменен, чтобы учесть символы, представление которых требует больше чем 16 битов. Диапазоном точек свода законов является теперь U+0000 к U+10FFFF, известному как скалярное значение Unicode. (Сошлитесь на
Набор символов от U+0000 до U+FFFF иногда упоминается как Основная Многоязычная Плоскость (BMP). Символы, кодовые точки которых больше чем U+FFFF, вызывают дополнительными символами. Платформа Java использует представление UTF-16 в char
массивы и в String
и StringBuffer
классы. В этом представлении дополнительные символы представляются как пара char
значения, первое от диапазона высоких заместителей, (\uD800-\uDBFF), второго от диапазона низких заместителей (\uDC00-\uDFFF).
A char
значение, поэтому, представляет Основную Многоязычную Плоскость (BMP) кодовые точки, включая суррогатные кодовые точки, или элементы кода кодирования UTF-16. int
значение представляет все кодовые точки Unicode, включая дополнительные кодовые точки. Ниже (младший значащий) 21 бит int
используются, чтобы представить кодовые точки Unicode, и верхние (старшие значащие) 11 битов должны быть нулем. Если иначе не определено, поведение относительно дополнительных символов и заместителя char
значения следующие:
char
значение не может поддерживать дополнительные символы. Они обрабатывают char
значения от заместителя располагаются как неопределенные символы. Например, Character.isLetter('\uD840')
возвраты false
, даже при том, что это определенное значение если бы сопровождающийся любым значением низкого заместителя в строке представило бы букву. int
оцените поддерживают все символы Unicode, включая дополнительные символы. Например, Character.isLetter(0x2F81A)
возвраты true
потому что значение кодовой точки представляет букву (идеограмма CJK). В Java документация API SE кодовая точка Unicode используется для символьных значений в диапазоне между U+0000 и U+10FFFF, и элемент кода Unicode используется для 16-разрядного char
значения, которые являются элементами кода кодирования UTF-16. Для получения дополнительной информации по терминологии Unicode сошлитесь на
Модификатор и Тип | Класс и Описание |
---|---|
static class |
Символ. Подмножество
Экземпляры этого class представляют определенные подмножества набора символов Unicode.
|
static class |
Символ. UnicodeBlock
Семейство символьных подмножеств, представляющих символ, блокирует в спецификации Unicode.
|
static class |
Символ. UnicodeScript
Семейство символьных подмножеств, представляющих символьные сценарии, определенные в
|
Модификатор и Тип | Поле и Описание |
---|---|
static int |
БАЙТЫ
Число байтов, используемых, чтобы представить a
char значение в двоичной форме без знака. |
static byte |
COMBINING_SPACING_MARK
Общая категория "Мегагерц" в спецификации Unicode.
|
static byte |
CONNECTOR_PUNCTUATION
Общая категория "Pc" в спецификации Unicode.
|
static byte |
УПРАВЛЕНИЕ
Общая категория "Cc" в спецификации Unicode.
|
static byte |
CURRENCY_SYMBOL
Общая категория "Кв/см" в спецификации Unicode.
|
static byte |
DASH_PUNCTUATION
Общая категория "Фунт" в спецификации Unicode.
|
static byte |
DECIMAL_DIGIT_NUMBER
Общая категория "Без обозначения даты" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_ARABIC_NUMBER
Слабый двунаправленный символьный тип "AN" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_BOUNDARY_NEUTRAL
Слабый двунаправленный символьный тип "BN" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Слабый двунаправленный символьный тип "CS" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER
Слабый двунаправленный символьный тип "EN" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Слабый двунаправленный символьный тип "ES" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Слабый двунаправленный символьный тип "И" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT
Сильный двунаправленный символьный тип "L" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Сильный двунаправленный символьный тип "LRE" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Сильный двунаправленный символьный тип "LRO" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_NONSPACING_MARK
Слабый двунаправленный символьный тип "NSM" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_OTHER_NEUTRALS
Нейтральный двунаправленный символьный тип "НА" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_PARAGRAPH_SEPARATOR
Нейтральный двунаправленный символьный тип "B" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Слабый двунаправленный символьный тип "PDF" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT
Сильный двунаправленный символьный тип "R" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Сильный двунаправленный символьный тип "AL" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Сильный двунаправленный символьный тип "RLE" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Сильный двунаправленный символьный тип "RLO" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_SEGMENT_SEPARATOR
Нейтральный двунаправленный символьный тип "S" в спецификации Unicode.
|
static byte |
DIRECTIONALITY_UNDEFINED
Неопределенный двунаправленный символьный тип.
|
static byte |
DIRECTIONALITY_WHITESPACE
Нейтральный двунаправленный символьный тип "WS" в спецификации Unicode.
|
static byte |
ENCLOSING_MARK
Общая категория "Я" в спецификации Unicode.
|
static byte |
END_PUNCTUATION
Общая категория "Pe" в спецификации Unicode.
|
static byte |
FINAL_QUOTE_PUNCTUATION
Общая категория "Pf" в спецификации Unicode.
|
static byte |
ФОРМАТ
Общая категория "Cf" в спецификации Unicode.
|
static byte |
INITIAL_QUOTE_PUNCTUATION
Общая категория "Пи" в спецификации Unicode.
|
static byte |
LETTER_NUMBER
Общая категория "Сш" в спецификации Unicode.
|
static byte |
LINE_SEPARATOR
Общая категория "Zl" в спецификации Unicode.
|
static byte |
LOWERCASE_LETTER
Общая категория "Ll" в спецификации Unicode.
|
static byte |
MATH_SYMBOL
Общая категория "См" в спецификации Unicode.
|
static int |
MAX_CODE_POINT
Максимальное значение
U+10FFFF . |
static char |
MAX_HIGH_SURROGATE
Максимальное значение
'\uDBFF' . |
static char |
MAX_LOW_SURROGATE
Максимальное значение
'\uDFFF' . |
static int |
MAX_RADIX
Максимальное основание, доступное для преобразования в и от строк.
|
static char |
MAX_SURROGATE
Максимальное значение элемента кода заместителя Unicode в кодировании UTF-16, постоянном
'\uDFFF' . |
static char |
MAX_VALUE
Постоянная величина этого поля является самым большим значением типа
char , '\uFFFF' . |
static int |
MIN_CODE_POINT
Минимальное значение
U+0000 . |
static char |
MIN_HIGH_SURROGATE
Минимальное значение
'\uD800' . |
static char |
MIN_LOW_SURROGATE
Минимальное значение
'\uDC00' . |
static int |
MIN_RADIX
Минимальное основание, доступное для преобразования в и от строк.
|
static int |
MIN_SUPPLEMENTARY_CODE_POINT
Минимальное значение
U+10000 . |
static char |
MIN_SURROGATE
Минимальное значение элемента кода заместителя Unicode в кодировании UTF-16, постоянном
'\uD800' . |
static char |
MIN_VALUE
Постоянная величина этого поля является самым маленьким значением типа
char , '\u0000' . |
static byte |
MODIFIER_LETTER
Общая категория "Lm" в спецификации Unicode.
|
static byte |
MODIFIER_SYMBOL
Общая категория "Sk" в спецификации Unicode.
|
static byte |
NON_SPACING_MARK
Общая категория "МС" в спецификации Unicode.
|
static byte |
OTHER_LETTER
Общая категория "Ло" в спецификации Unicode.
|
static byte |
OTHER_NUMBER
Общая категория "Нет" в спецификации Unicode.
|
static byte |
OTHER_PUNCTUATION
Общая категория "По" в спецификации Unicode.
|
static byte |
OTHER_SYMBOL
Общая категория "Так" в спецификации Unicode.
|
static byte |
PARAGRAPH_SEPARATOR
Общая категория "Zp" в спецификации Unicode.
|
static byte |
PRIVATE_USE
Общая категория "Ко" в спецификации Unicode.
|
static int |
РАЗМЕР
Число битов, используемых, чтобы представить значение char в двоичной форме без знака, постоянной
16 . |
static byte |
SPACE_SEPARATOR
Общая категория "Zs" в спецификации Unicode.
|
static byte |
START_PUNCTUATION
Общая категория "Постскриптум" в спецификации Unicode.
|
static byte |
ЗАМЕСТИТЕЛЬ
Общая категория "Cs" в спецификации Unicode.
|
static byte |
TITLECASE_LETTER
Общая категория "Лейтенант" в спецификации Unicode.
|
static Class<Character> |
ВВЕСТИ
Class экземпляр, представляющий тип примитива char . |
static byte |
НЕПРИСВОЕННЫЙ
Общая категория "Cn" в спецификации Unicode.
|
static byte |
UPPERCASE_LETTER
Общая категория "Лютеций" в спецификации Unicode.
|
Конструктор и Описание |
---|
Character(char value)
Создает недавно выделенный
Character объект, который представляет указанное char значение. |
Модификатор и Тип | Метод и Описание |
---|---|
static int |
charCount(int codePoint)
Определяет число
char значения должны были представить указанный символ (кодовая точка Unicode). |
char |
charValue()
Возвращает значение этого
Character объект. |
static int |
codePointAt(char[] a, int index)
Возвращается кодовая точка в данном индексируют
char массив. |
static int |
codePointAt(char[] a, int index, int limit)
Возвращается кодовая точка в данном индексируют
char массив, где только выстраивают элементы с index меньше чем limit может использоваться. |
static int |
codePointAt(CharSequence seq, int index)
Возвращается кодовая точка в данном индексируют
CharSequence . |
static int |
codePointBefore(char[] a, int index)
Возвращается кодовая точка, предшествующая данному, индексируют
char массив. |
static int |
codePointBefore(char[] a, int index, int start)
Возвращается кодовая точка, предшествующая данному, индексируют
char массив, где только выстраивают элементы с index больше чем или равный start может использоваться. |
static int |
codePointBefore(CharSequence seq, int index)
Возвращается кодовая точка, предшествующая данному, индексируют
CharSequence . |
static int |
codePointCount(char[] a, int offset, int count)
Возвращает число кодовых точек Unicode в подмассиве
char параметр массива. |
static int |
codePointCount(CharSequence seq, int beginIndex, int endIndex)
Возвращает число кодовых точек Unicode в текстовом диапазоне указанной последовательности случайной работы.
|
static int |
compare(char x, char y)
Сравнивается два
char значения в цифровой форме. |
int |
compareTo(Character anotherCharacter)
Сравнивается два
Character объекты в цифровой форме. |
static int |
digit(char ch, int radix)
Возвращает числовое значение символа
ch в указанном основании. |
static int |
digit(int codePoint, int radix)
Возвращает числовое значение указанного символа (кодовая точка Unicode) в указанном основании.
|
boolean |
equals(Object obj)
Сравнивает этот объект с указанным объектом.
|
static char |
forDigit(int digit, int radix)
Определяет символьное представление для определенной цифры в указанном основании.
|
static byte |
getDirectionality(char ch)
Возвращает свойство направленности Unicode для данного символа.
|
static byte |
getDirectionality(int codePoint)
Возвращает свойство направленности Unicode для данного символа (кодовая точка Unicode).
|
static String |
getName(int codePoint)
Возвращает имя Unicode указанного символа
codePoint , или нуль, если кодовая точка unassigned . |
static int |
getNumericValue(char ch)
Возвраты
int значение, которое представляет указанный символ Unicode. |
static int |
getNumericValue(int codePoint)
Возвраты
int значение, которое представляет указанный символ (кодовая точка Unicode). |
static int |
getType(char ch)
Возвращает значение, указывающее на общую категорию символа.
|
static int |
getType(int codePoint)
Возвращает значение, указывающее на общую категорию символа.
|
int |
hashCode()
Возвращает хэш-код для этого
Character ; равный результату вызова charValue() . |
static int |
hashCode(char value)
Возвращает хэш-код для a
char значение; совместимый с Character.hashCode() . |
static char |
highSurrogate(int codePoint)
Возвращает ведущего заместителя (
|
static boolean |
isAlphabetic(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) алфавитом.
|
static boolean |
isBmpCodePoint(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) в Основной Многоязычной Плоскости (BMP).
|
static boolean |
isDefined(char ch)
Определяет, определяется ли символ в Unicode.
|
static boolean |
isDefined(int codePoint)
Определяет, определяется ли символ (кодовая точка Unicode) в Unicode.
|
static boolean |
isDigit(char ch)
Определяет, является ли указанный символ цифрой.
|
static boolean |
isDigit(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) цифрой.
|
static boolean |
isHighSurrogate(char ch)
Определяет если данный
char значение является |
static boolean |
isIdentifierIgnorable(char ch)
Определяет, должен ли указанный символ быть расценен как игнорируемый символ в идентификаторе Java или идентификаторе Unicode.
|
static boolean |
isIdentifierIgnorable(int codePoint)
Определяет, должен ли указанный символ (кодовая точка Unicode) быть расценен как игнорируемый символ в идентификаторе Java или идентификаторе Unicode.
|
static boolean |
isIdeographic(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) CJKV (китайский, японский, корейский и вьетнамский язык) идеограмма, как определено Стандартом Unicode.
|
static boolean |
isISOControl(char ch)
Определяет, является ли указанный символ управляющим символом ISO.
|
static boolean |
isISOControl(int codePoint)
Определяет, является ли символ, на который ссылаются (кодовая точка Unicode) управляющим символом ISO.
|
static boolean |
isJavaIdentifierPart(char ch)
Определяет, может ли указанный символ быть частью идентификатора Java как кроме первого символа.
|
static boolean |
isJavaIdentifierPart(int codePoint)
Определяет, может ли символ (кодовая точка Unicode) быть частью идентификатора Java как кроме первого символа.
|
static boolean |
isJavaIdentifierStart(char ch)
Определяет, допустим ли указанный символ как первый символ в идентификаторе Java.
|
static boolean |
isJavaIdentifierStart(int codePoint)
Определяет, допустим ли символ (кодовая точка Unicode) как первый символ в идентификаторе Java.
|
static boolean |
isJavaLetter(char ch)
Осуждаемый.
Замененный isJavaIdentifierStart (случайная работа).
|
static boolean |
isJavaLetterOrDigit(char ch)
Осуждаемый.
Замененный isJavaIdentifierPart (случайная работа).
|
static boolean |
isLetter(char ch)
Определяет, является ли указанный символ буквой.
|
static boolean |
isLetter(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) буквой.
|
static boolean |
isLetterOrDigit(char ch)
Определяет, является ли указанный символ буквой или цифрой.
|
static boolean |
isLetterOrDigit(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) буквой или цифрой.
|
static boolean |
isLowerCase(char ch)
Определяет, является ли указанный символ символом нижнего регистра.
|
static boolean |
isLowerCase(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) символом нижнего регистра.
|
static boolean |
isLowSurrogate(char ch)
Определяет если данный
char значение является |
static boolean |
isMirrored(char ch)
Определяет, зеркально отражается ли символ согласно спецификации Unicode.
|
static boolean |
isMirrored(int codePoint)
Определяет, зеркально отражается ли указанный символ (кодовая точка Unicode) согласно спецификации Unicode.
|
static boolean |
isSpace(char ch)
Осуждаемый.
Замененный isWhitespace (случайная работа).
|
static boolean |
isSpaceChar(char ch)
Определяет, является ли указанный символ пробелом Unicode.
|
static boolean |
isSpaceChar(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) пробелом Unicode.
|
static boolean |
isSupplementaryCodePoint(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) в дополнительном диапазоне символов.
|
static boolean |
isSurrogate(char ch)
Определяет если данный
char значение является элементом кода заместителя Unicode. |
static boolean |
isSurrogatePair(char high, char low)
Определяет ли указанная пара
char значения являются допустимой |
static boolean |
isTitleCase(char ch)
Определяет, является ли указанный символ titlecase символом.
|
static boolean |
isTitleCase(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) titlecase символом.
|
static boolean |
isUnicodeIdentifierPart(char ch)
Определяет, может ли указанный символ быть частью идентификатора Unicode как кроме первого символа.
|
static boolean |
isUnicodeIdentifierPart(int codePoint)
Определяет, может ли указанный символ (кодовая точка Unicode) быть частью идентификатора Unicode как кроме первого символа.
|
static boolean |
isUnicodeIdentifierStart(char ch)
Определяет, допустим ли указанный символ как первый символ в идентификаторе Unicode.
|
static boolean |
isUnicodeIdentifierStart(int codePoint)
Определяет, допустим ли указанный символ (кодовая точка Unicode) как первый символ в идентификаторе Unicode.
|
static boolean |
isUpperCase(char ch)
Определяет, является ли указанный символ символом верхнего регистра.
|
static boolean |
isUpperCase(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) символом верхнего регистра.
|
static boolean |
isValidCodePoint(int codePoint)
Определяет, является ли указанная кодовая точка допустимым
|
static boolean |
isWhitespace(char ch)
Определяет, является ли указанный символ пробелом согласно Java.
|
static boolean |
isWhitespace(int codePoint)
Определяет, является ли указанный символ (кодовая точка Unicode) пробелом согласно Java.
|
static char |
lowSurrogate(int codePoint)
Возвращает запаздывающего заместителя (
|
static int |
offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
Возвращает индексирование в пределах данного
char подмассив, который смещается от данного index codePointOffset кодовые точки. |
static int |
offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
Возвращает индексирование в пределах данной последовательности случайной работы, которая смещается от данного
index codePointOffset кодовые точки. |
static char |
reverseBytes(char ch)
Возвращает значение, полученное, инвертируя порядок байтов в указанном значении char.
|
static char[] |
toChars(int codePoint)
Преобразовывает указанный символ (кодовая точка Unicode) к ее представлению UTF-16, сохраненному в a
char массив. |
static int |
toChars(int codePoint, char[] dst, int dstIndex)
Преобразовывает указанный символ (кодовая точка Unicode) к ее представлению UTF-16.
|
static int |
toCodePoint(char high, char low)
Преобразовывает указанную суррогатную пару в ее дополнительное значение кодовой точки.
|
static char |
toLowerCase(char ch)
Преобразовывает символьный параметр нижнему регистру, используя информацию об отображении случая от файла UnicodeData.
|
static int |
toLowerCase(int codePoint)
Преобразовывает символ (кодовая точка Unicode) параметр нижнему регистру, используя информацию об отображении случая от файла UnicodeData.
|
Строка |
toString()
Возвраты a
String объект, представляющий это Character 's значение. |
static String |
toString(char c)
Возвраты a
String объект, представляющий указанное char . |
static char |
toTitleCase(char ch)
Преобразовывает символьный параметр titlecase использование информации об отображении случая от файла UnicodeData.
|
static int |
toTitleCase(int codePoint)
Преобразовывает символ (кодовая точка Unicode) параметр titlecase использование информации об отображении случая от файла UnicodeData.
|
static char |
toUpperCase(char ch)
Преобразовывает символьный параметр верхнему регистру, используя информацию об отображении случая от файла UnicodeData.
|
static int |
toUpperCase(int codePoint)
Преобразовывает символ (кодовая точка Unicode) параметр верхнему регистру, используя информацию об отображении случая от файла UnicodeData.
|
static Character |
valueOf(char c)
Возвращает экземпляр Character, представляющий указанное значение char.
|
public static final int MIN_RADIX
digit
метод, forDigit
метод, и toString
метод class Integer
.public static final int MAX_RADIX
digit
метод, forDigit
метод, и toString
метод class Integer
.public static final char MIN_VALUE
char
, '\u0000'
.public static final char MAX_VALUE
char
, '\uFFFF'
.public static final Class<Character> TYPE
Class
экземпляр, представляющий тип примитива char
.public static final byte UNASSIGNED
public static final byte UPPERCASE_LETTER
public static final byte LOWERCASE_LETTER
public static final byte TITLECASE_LETTER
public static final byte MODIFIER_LETTER
public static final byte OTHER_LETTER
public static final byte NON_SPACING_MARK
public static final byte ENCLOSING_MARK
public static final byte COMBINING_SPACING_MARK
public static final byte DECIMAL_DIGIT_NUMBER
public static final byte LETTER_NUMBER
public static final byte OTHER_NUMBER
public static final byte SPACE_SEPARATOR
public static final byte LINE_SEPARATOR
public static final byte PARAGRAPH_SEPARATOR
public static final byte CONTROL
public static final byte FORMAT
public static final byte PRIVATE_USE
public static final byte SURROGATE
public static final byte DASH_PUNCTUATION
public static final byte START_PUNCTUATION
public static final byte END_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATION
public static final byte OTHER_PUNCTUATION
public static final byte MATH_SYMBOL
public static final byte CURRENCY_SYMBOL
public static final byte MODIFIER_SYMBOL
public static final byte OTHER_SYMBOL
public static final byte INITIAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATION
public static final byte DIRECTIONALITY_UNDEFINED
char
у значений есть неопределенная направленность в спецификации Unicode.public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final char MIN_HIGH_SURROGATE
'\uD800'
. Высокий заместитель также известен как ведущий заместитель.public static final char MAX_HIGH_SURROGATE
'\uDBFF'
. Высокий заместитель также известен как ведущий заместитель.public static final char MIN_LOW_SURROGATE
'\uDC00'
. Низкий заместитель также известен как заместитель запаздывания.public static final char MAX_LOW_SURROGATE
'\uDFFF'
. Низкий заместитель также известен как заместитель запаздывания.public static final char MIN_SURROGATE
'\uD800'
.public static final char MAX_SURROGATE
'\uDFFF'
.public static final int MIN_SUPPLEMENTARY_CODE_POINT
U+10000
.public static final int MIN_CODE_POINT
U+0000
.public static final int MAX_CODE_POINT
U+10FFFF
.public static final int SIZE
16
.public static final int BYTES
char
значение в двоичной форме без знака.public Character(char value)
Character
объект, который представляет указанное char
значение.value
- значение, которое будет представлено Character
объект.public static Character valueOf(char c)
Character(char)
, поскольку этот метод, вероятно, приведет к значительно лучшей производительности пространства и времени, кэшируя часто требуемые значения. Этот метод будет всегда кэшировать значения в диапазоне '\u0000'
к '\u007F'
, включительно, и может кэшировать другие значения за пределами этого диапазона.c
- значение случайной работы.public char charValue()
Character
объект.char
значение представляется этим объектом.public int hashCode()
Character
; равный результату вызова charValue()
.hashCode
в class Object
Character
Object.equals(java.lang.Object)
, System.identityHashCode(java.lang.Object)
public static int hashCode(char value)
char
значение; совместимый с Character.hashCode()
.char
значение.public boolean equals(Object obj)
true
если и только если параметр не null
и a Character
объект, который представляет то же самое char
оцените как этот объект.equals
в class Object
obj
- объект сравниться с.true
если объекты являются тем же самым; false
иначе.Object.hashCode()
, HashMap
public String toString()
String
объект, представляющий это Character
's значение. Результатом является строка длины 1, чей единственный компонент является примитивом char
значение представляется этим Character
объект.public static String toString(char c)
String
объект, представляющий указанное char
. Результатом является строка длины 1 состоящий исключительно из указанного char
.c
- char
быть преобразованнымchar
public static boolean isValidCodePoint(int codePoint)
codePoint
- кодовая точка Unicode, которая будет протестированаtrue
если указанное значение кодовой точки между MIN_CODE_POINT
и MAX_CODE_POINT
включительно; false
иначе.public static boolean isBmpCodePoint(int codePoint)
char
.public static boolean isSupplementaryCodePoint(int codePoint)
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированнымtrue
если указанная кодовая точка между MIN_SUPPLEMENTARY_CODE_POINT
и MAX_CODE_POINT
включительно; false
иначе.public static boolean isHighSurrogate(char ch)
char
значение является Такие значения не представляют символы, но используются в представлении дополнительных символов в кодировании UTF-16.
ch
- char
значение, которое будет протестировано.true
если char
значение между MIN_HIGH_SURROGATE
и MAX_HIGH_SURROGATE
включительно; false
иначе.isLowSurrogate(char)
, Character.UnicodeBlock.of(int)
public static boolean isLowSurrogate(char ch)
char
значение является Такие значения не представляют символы, но используются в представлении дополнительных символов в кодировании UTF-16.
ch
- char
значение, которое будет протестировано.true
если char
значение между MIN_LOW_SURROGATE
и MAX_LOW_SURROGATE
включительно; false
иначе.isHighSurrogate(char)
public static boolean isSurrogate(char ch)
char
значение является элементом кода заместителя Unicode. Такие значения не представляют символы, но используются в представлении дополнительных символов в кодировании UTF-16.
Значение случайной работы является суррогатным элементом кода, если и только если это - или элемент кода низкого заместителя или высоко-суррогатный элемент кода.
ch
- char
значение, которое будет протестировано.true
если char
значение между MIN_SURROGATE
и MAX_SURROGATE
включительно; false
иначе.public static boolean isSurrogatePair(char high, char low)
char
значения являются допустимой Этот метод эквивалентен выражению:
isHighSurrogate(high) && isLowSurrogate(low)
high
- высоко-суррогатное кодовое обозначение, которое будет протестированоlow
- кодовое обозначение низкого заместителя, которое будет протестированоtrue
если указанный верхний уровень и кодовые обозначения низкого заместителя представляют допустимую суррогатную пару; false
иначе.public static int charCount(int codePoint)
char
значения должны были представить указанный символ (кодовая точка Unicode). Если указанный символ равен или больше чем 0x10000, то метод возвращается 2. Иначе, метод возвращается 1. Этот метод не проверяет указанного символа, чтобы быть допустимой кодовой точкой Unicode. Вызывающая сторона должна проверить символьного использования значения isValidCodePoint
в случае необходимости.
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.isSupplementaryCodePoint(int)
public static int toCodePoint(char high, char low)
isSurrogatePair
в случае необходимости.high
- высоко-суррогатный элемент кодаlow
- элемент кода низкого заместителяpublic static int codePointAt(CharSequence seq, int index)
CharSequence
. Если char
значение в данном индексирует в CharSequence
находится в высоко-суррогатном диапазоне, следующее индексируют, меньше чем длина CharSequence
, и char
значение в следующем индексирует, находится в диапазоне низкого заместителя, тогда дополнительная кодовая точка, соответствующая этой суррогатной паре, возвращается. Иначе, char
значение в данном индексирует, возвращается.seq
- последовательность char
значения (элементы кода Unicode)index
- индексирование к char
значения (элементы кода Unicode) в seq
быть преобразованнымNullPointerException
- если seq
нуль.IndexOutOfBoundsException
- если значение index
отрицательно или не меньше чем seq.length()
.public static int codePointAt(char[] a, int index)
char
массив. Если char
значение в данном индексирует в char
массив находится в высоко-суррогатном диапазоне, следующее индексируют, меньше чем длина char
массив, и char
значение в следующем индексирует, находится в диапазоне низкого заместителя, тогда дополнительная кодовая точка, соответствующая этой суррогатной паре, возвращается. Иначе, char
значение в данном индексирует, возвращается.a
- char
массивindex
- индексирование к char
значения (элементы кода Unicode) в char
массив, который будет преобразованNullPointerException
- если a
нуль.IndexOutOfBoundsException
- если значение index
отрицательно или не меньше чем длина char
массив.public static int codePointAt(char[] a, int index, int limit)
char
массив, где только выстраивают элементы с index
меньше чем limit
может использоваться. Если char
значение в данном индексирует в char
массив находится в высоко-суррогатном диапазоне, следующее индексируют, меньше чем limit
, и char
значение в следующем индексирует, находится в диапазоне низкого заместителя, тогда дополнительная кодовая точка, соответствующая этой суррогатной паре, возвращается. Иначе, char
значение в данном индексирует, возвращается.a
- char
массивindex
- индексирование к char
значения (элементы кода Unicode) в char
массив, который будет преобразованlimit
- индексирование после последнего элемента массива, который может использоваться в char
массивNullPointerException
- если a
нуль.IndexOutOfBoundsException
- если index
параметр отрицателен или не меньше чем limit
параметр, или если limit
параметр отрицателен или больше чем длина char
массив.public static int codePointBefore(CharSequence seq, int index)
CharSequence
. Если char
значение в (index - 1)
в CharSequence
находится в диапазоне низкого заместителя, (index - 2)
не отрицательно, и char
значение в (index - 2)
в CharSequence
находится в высоко-суррогатном диапазоне, тогда дополнительная кодовая точка, соответствующая этой суррогатной паре, возвращается. Иначе, char
значение в (index - 1)
возвращается.seq
- CharSequence
экземплярindex
- индексирование после кодовой точки, которая должна быть возвращенаNullPointerException
- если seq
нуль.IndexOutOfBoundsException
- если index
параметр - меньше чем 1 или больше чем seq.length()
.public static int codePointBefore(char[] a, int index)
char
массив. Если char
значение в (index - 1)
в char
массив находится в диапазоне низкого заместителя, (index - 2)
не отрицательно, и char
значение в (index - 2)
в char
массив находится в высоко-суррогатном диапазоне, тогда дополнительная кодовая точка, соответствующая этой суррогатной паре, возвращается. Иначе, char
значение в (index - 1)
возвращается.a
- char
массивindex
- индексирование после кодовой точки, которая должна быть возвращенаNullPointerException
- если a
нуль.IndexOutOfBoundsException
- если index
параметр - меньше чем 1 или больше чем длина char
массивpublic static int codePointBefore(char[] a, int index, int start)
char
массив, где только выстраивают элементы с index
больше чем или равный start
может использоваться. Если char
значение в (index - 1)
в char
массив находится в диапазоне низкого заместителя, (index - 2)
не меньше чем start
, и char
значение в (index - 2)
в char
массив находится в высоко-суррогатном диапазоне, тогда дополнительная кодовая точка, соответствующая этой суррогатной паре, возвращается. Иначе, char
значение в (index - 1)
возвращается.a
- char
массивindex
- индексирование после кодовой точки, которая должна быть возвращенаstart
- индексирование первого элемента массива в char
массивNullPointerException
- если a
нуль.IndexOutOfBoundsException
- если index
параметр не больше чем start
параметр или больше чем длина char
массив, или если start
параметр отрицателен или не меньше чем длина char
массив.public static char highSurrogate(int codePoint)
char
возвращается. Если isSupplementaryCodePoint(x)
true
, тогда isHighSurrogate
(highSurrogate(x))
и toCodePoint
(highSurrogate(x),
lowSurrogate
(x)) == x
также всегда true
.
codePoint
- дополнительный символ (кодовая точка Unicode)public static char lowSurrogate(int codePoint)
char
возвращается. Если isSupplementaryCodePoint(x)
true
, тогда isLowSurrogate
(lowSurrogate(x))
и toCodePoint
(
highSurrogate
(x), lowSurrogate(x)) == x
также всегда true
.
codePoint
- дополнительный символ (кодовая точка Unicode)public static int toChars(int codePoint, char[] dst, int dstIndex)
dst[dstIndex]
, и 1 возвращается. Если указанная кодовая точка является дополнительным символом, его суррогатные значения сохранены в dst[dstIndex]
(высокий заместитель) и dst[dstIndex+1]
(низкий заместитель), и 2 возвращается.codePoint
- символ (кодовая точка Unicode), чтобы быть преобразованным.dst
- массив char
в котором codePoint
's UTF-16 значение сохранен.dstIndex
- запуск индексирует в dst
выстройте, где преобразованное значение сохранено.IllegalArgumentException
- если указанное codePoint
не допустимая кодовая точка Unicode.NullPointerException
- если указанное dst
нуль.IndexOutOfBoundsException
- если dstIndex
отрицательно или не меньше чем dst.length
, или если dst
в dstIndex
не имеет достаточного количества элемента (ов) массива, чтобы сохранить получающееся char
значение (я). (Если dstIndex
равно dst.length-1
и указанное codePoint
дополнительный символ, высоко-суррогатное значение не сохранено в dst[dstIndex]
.)public static char[] toChars(int codePoint)
char
массив. Если указанная кодовая точка является BMP (Основная Многоязычная Плоскость или Плоскость 0) значение, получающееся char
у массива есть то же самое значение как codePoint
. Если указанная кодовая точка является дополнительной кодовой точкой, получающимся char
у массива есть соответствующая суррогатная пара.codePoint
- кодовая точка Unicodechar
наличие массива codePoint
's UTF-16 представление.IllegalArgumentException
- если указанное codePoint
не допустимая кодовая точка Unicode.public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
beginIndex
и расширяется на char
в индексируют endIndex - 1
. Таким образом длина (в char
s) из текста диапазон endIndex-beginIndex
. Непарные заместители в пределах текста располагаются количество как одна кодовая точка каждый.seq
- последовательность случайной работыbeginIndex
- индексирование к первому char
из текстового диапазона.endIndex
- индексирование после последнего char
из текстового диапазона.NullPointerException
- если seq
нуль.IndexOutOfBoundsException
- если beginIndex
отрицательно, или endIndex
больше чем длина данной последовательности, или beginIndex
больше чем endIndex
.public static int codePointCount(char[] a, int offset, int count)
char
параметр массива. offset
параметром является индексирование первого char
из подмассива и count
параметр определяет длину подмассива в char
s. Непарные заместители в пределах подмассива рассчитывают как одна кодовая точка каждый.a
- char
массивoffset
- индексирование первого char
в данном char
массивcount
- длина подмассива в char
sNullPointerException
- если a
нуль.IndexOutOfBoundsException
- если offset
или count
отрицательно, или если offset + count
больше чем длина данного массива.public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
index
codePointOffset
кодовые точки. Непарные заместители в пределах текстового диапазона, данного index
и codePointOffset
рассчитайте как одна кодовая точка каждый.seq
- последовательность случайной работыindex
- индексирование, которое будет смещеноcodePointOffset
- смещение в кодовых точкахNullPointerException
- если seq
нуль.IndexOutOfBoundsException
- если index
отрицательно или больше тогда длина последовательности случайной работы, или если codePointOffset
положительно и подпоследовательность, запускающаяся с index
имеет меньше чем codePointOffset
кодовые точки, или если codePointOffset
отрицательно и подпоследовательность прежде index
имеет меньше чем абсолютное значение codePointOffset
кодовые точки.public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
char
подмассив, который смещается от данного index
codePointOffset
кодовые точки. start
и count
параметры определяют подмассив char
массив. Непарные заместители в пределах текстового диапазона, данного index
и codePointOffset
рассчитайте как одна кодовая точка каждый.a
- char
массивstart
- индексирование первого char
из подмассиваcount
- длина подмассива в char
sindex
- индексирование, которое будет смещеноcodePointOffset
- смещение в кодовых точкахNullPointerException
- если a
нуль.IndexOutOfBoundsException
- если start
или count
отрицательно, или если start + count
больше чем длина данного массива, или если index
меньше чем start
или больше тогда start + count
, или если codePointOffset
положительно и текстовый диапазон, запускающийся с index
и окончание start + count - 1
имеет меньше чем codePointOffset
кодовые точки, или если codePointOffset
отрицательно и текстовый диапазон, запускающийся с start
и окончание index - 1
имеет меньше чем абсолютное значение codePointOffset
кодовые точки.public static boolean isLowerCase(char ch)
Символ является нижним регистром если его общий тип категории, обеспеченный Character.getType(ch)
, LOWERCASE_LETTER
, или у этого есть сотрудничающее свойство Other_Lowercase как определено Стандартом Unicode.
Следующее является примерами символов нижнего регистра:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Много других символов Unicode являются нижним регистром также.
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isLowerCase(int)
метод.
ch
- символ, который будет протестирован.true
если символ является нижним регистром; false
иначе.isLowerCase(char)
, isTitleCase(char)
, toLowerCase(char)
, getType(char)
public static boolean isLowerCase(int codePoint)
Символ является нижним регистром если его общий тип категории, обеспеченный getType(codePoint)
, LOWERCASE_LETTER
, или у этого есть сотрудничающее свойство Other_Lowercase как определено Стандартом Unicode.
Следующее является примерами символов нижнего регистра:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
Много других символов Unicode являются нижним регистром также.
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является нижним регистром; false
иначе.isLowerCase(int)
, isTitleCase(int)
, toLowerCase(int)
, getType(int)
public static boolean isUpperCase(char ch)
Символ является верхним регистром если его общий тип категории, обеспеченный Character.getType(ch)
, UPPERCASE_LETTER
. или у этого есть сотрудничающее свойство Other_Uppercase как определено Стандартом Unicode.
Следующее является примерами символов верхнего регистра:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Много других символов Unicode являются верхним регистром также.
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isUpperCase(int)
метод.
ch
- символ, который будет протестирован.true
если символ является верхним регистром; false
иначе.isLowerCase(char)
, isTitleCase(char)
, toUpperCase(char)
, getType(char)
public static boolean isUpperCase(int codePoint)
Символ является верхним регистром если его общий тип категории, обеспеченный getType(codePoint)
, UPPERCASE_LETTER
, или у этого есть сотрудничающее свойство Other_Uppercase как определено Стандартом Unicode.
Следующее является примерами символов верхнего регистра:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
Много других символов Unicode являются верхним регистром также.
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является верхним регистром; false
иначе.isLowerCase(int)
, isTitleCase(int)
, toUpperCase(int)
, getType(int)
public static boolean isTitleCase(char ch)
Символ является titlecase символом если его общий тип категории, обеспеченный Character.getType(ch)
, TITLECASE_LETTER
.
Некоторые символы похожи на пар латинских букв. Например, есть прописная буква, которая похожа "на LJ" и имеет соответствующую строчную букву, которая похожа "на lj". Третья форма, которая похожа "на Lj", является соответствующей формой, чтобы использовать, представляя слово в нижнем регистре с начальными прописными буквами, что касается книги title.
Они - некоторые из символов Unicode, для которых возвращается этот метод true
:
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Много других символов Unicode являются titlecase также.
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isTitleCase(int)
метод.
ch
- символ, который будет протестирован.true
если символ является titlecase; false
иначе.isLowerCase(char)
, isUpperCase(char)
, toTitleCase(char)
, getType(char)
public static boolean isTitleCase(int codePoint)
Символ является titlecase символом если его общий тип категории, обеспеченный getType(codePoint)
, TITLECASE_LETTER
.
Некоторые символы похожи на пар латинских букв. Например, есть прописная буква, которая похожа "на LJ" и имеет соответствующую строчную букву, которая похожа "на lj". Третья форма, которая похожа "на Lj", является соответствующей формой, чтобы использовать, представляя слово в нижнем регистре с начальными прописными буквами, что касается книги title.
Они - некоторые из символов Unicode, для которых возвращается этот метод true
:
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
LATIN CAPITAL LETTER L WITH SMALL LETTER J
LATIN CAPITAL LETTER N WITH SMALL LETTER J
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
Много других символов Unicode являются titlecase также.
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является titlecase; false
иначе.isLowerCase(int)
, isUpperCase(int)
, toTitleCase(int)
, getType(int)
public static boolean isDigit(char ch)
Символ является цифрой если ее общий тип категории, обеспеченный Character.getType(ch)
, DECIMAL_DIGIT_NUMBER
.
Некоторые диапазоны символов Unicode, которые содержат цифры:
'\u0030'
через '\u0039'
, Цифры ISO-LATIN-1 ('0'
через '9'
) '\u0660'
через '\u0669'
, Арабско-относящиеся к Индии цифры '\u06F0'
через '\u06F9'
, Расширенные Арабско-относящиеся к Индии цифры '\u0966'
через '\u096F'
, Цифры деванагари '\uFF10'
через '\uFF19'
, Полноширинные цифры Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isDigit(int)
метод.
ch
- символ, который будет протестирован.true
если символ является цифрой; false
иначе.digit(char, int)
, forDigit(int, int)
, getType(char)
public static boolean isDigit(int codePoint)
Символ является цифрой если ее общий тип категории, обеспеченный getType(codePoint)
, DECIMAL_DIGIT_NUMBER
.
Некоторые диапазоны символов Unicode, которые содержат цифры:
'\u0030'
через '\u0039'
, Цифры ISO-LATIN-1 ('0'
через '9'
) '\u0660'
через '\u0669'
, Арабско-относящиеся к Индии цифры '\u06F0'
через '\u06F9'
, Расширенные Арабско-относящиеся к Индии цифры '\u0966'
через '\u096F'
, Цифры деванагари '\uFF10'
через '\uFF19'
, Полноширинные цифры codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является цифрой; false
иначе.forDigit(int, int)
, getType(int)
public static boolean isDefined(char ch)
Символ определяется, если по крайней мере одно из следующего является истиной:
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isDefined(int)
метод.
ch
- символ, который будет протестированtrue
если у символа есть определенное значение в Unicode; false
иначе.isDigit(char)
, isLetter(char)
, isLetterOrDigit(char)
, isLowerCase(char)
, isTitleCase(char)
, isUpperCase(char)
public static boolean isDefined(int codePoint)
Символ определяется, если по крайней мере одно из следующего является истиной:
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если у символа есть определенное значение в Unicode; false
иначе.isDigit(int)
, isLetter(int)
, isLetterOrDigit(int)
, isLowerCase(int)
, isTitleCase(int)
, isUpperCase(int)
public static boolean isLetter(char ch)
Символ, как полагают, является буквой если ее общий тип категории, обеспеченный Character.getType(ch)
, любое следующее:
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isLetter(int)
метод.
ch
- символ, который будет протестирован.true
если символ является буквой; false
иначе.isDigit(char)
, isJavaIdentifierStart(char)
, isJavaLetter(char)
, isJavaLetterOrDigit(char)
, isLetterOrDigit(char)
, isLowerCase(char)
, isTitleCase(char)
, isUnicodeIdentifierStart(char)
, isUpperCase(char)
public static boolean isLetter(int codePoint)
Символ, как полагают, является буквой если ее общий тип категории, обеспеченный getType(codePoint)
, любое следующее:
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является буквой; false
иначе.isDigit(int)
, isJavaIdentifierStart(int)
, isLetterOrDigit(int)
, isLowerCase(int)
, isTitleCase(int)
, isUnicodeIdentifierStart(int)
, isUpperCase(int)
public static boolean isLetterOrDigit(char ch)
Символ, как полагают, является буквой или цифрой если также Character.isLetter(char ch)
или Character.isDigit(char ch)
возвраты true
для символа.
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isLetterOrDigit(int)
метод.
ch
- символ, который будет протестирован.true
если символ является буквой или цифрой; false
иначе.isDigit(char)
, isJavaIdentifierPart(char)
, isJavaLetter(char)
, isJavaLetterOrDigit(char)
, isLetter(char)
, isUnicodeIdentifierPart(char)
public static boolean isLetterOrDigit(int codePoint)
Символ, как полагают, является буквой или цифрой если также isLetter(codePoint)
или isDigit(codePoint)
возвраты true
для символа.
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является буквой или цифрой; false
иначе.isDigit(int)
, isJavaIdentifierPart(int)
, isLetter(int)
, isUnicodeIdentifierPart(int)
@Deprecated public static boolean isJavaLetter(char ch)
Символ может запустить идентификатор Java, если и только если одно из следующего является истиной:
isLetter(ch)
возвраты true
getType(ch)
возвраты LETTER_NUMBER
ch
обозначение денежной единицы (такой как '$'
) ch
соединяющийся символ пунктуации (такой как '_'
). ch
- символ, который будет протестирован.true
если символ может запустить идентификатор Java; false
иначе.isJavaLetterOrDigit(char)
, isJavaIdentifierStart(char)
, isJavaIdentifierPart(char)
, isLetter(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierStart(char)
@Deprecated public static boolean isJavaLetterOrDigit(char ch)
Символ может быть частью идентификатора Java, если и только если любое следующее является истиной:
'$'
) '_'
) isIdentifierIgnorable
возвраты true
для символа. ch
- символ, который будет протестирован.true
если символ может быть частью идентификатора Java; false
иначе.isJavaLetter(char)
, isJavaIdentifierStart(char)
, isJavaIdentifierPart(char)
, isLetter(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierPart(char)
, isIdentifierIgnorable(char)
public static boolean isAlphabetic(int codePoint)
Символ, как полагают, является алфавитным если его общий тип категории, обеспеченный getType(codePoint)
, любое следующее:
UPPERCASE_LETTER
LOWERCASE_LETTER
TITLECASE_LETTER
MODIFIER_LETTER
OTHER_LETTER
LETTER_NUMBER
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является символом алфавита Unicode, false
иначе.public static boolean isIdeographic(int codePoint)
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является символом идеограммы Unicode, false
иначе.public static boolean isJavaIdentifierStart(char ch)
Символ может запустить идентификатор Java, если и только если одно из следующих условий является истиной:
isLetter(ch)
возвраты true
getType(ch)
возвраты LETTER_NUMBER
ch
обозначение денежной единицы (такой как '$'
) ch
соединяющийся символ пунктуации (такой как '_'
). Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isJavaIdentifierStart(int)
метод.
ch
- символ, который будет протестирован.true
если символ может запустить идентификатор Java; false
иначе.isJavaIdentifierPart(char)
, isLetter(char)
, isUnicodeIdentifierStart(char)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierStart(int codePoint)
Символ может запустить идентификатор Java, если и только если одно из следующих условий является истиной:
isLetter(codePoint)
возвраты true
getType(codePoint)
возвраты LETTER_NUMBER
'$'
) '_'
). codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ может запустить идентификатор Java; false
иначе.isJavaIdentifierPart(int)
, isLetter(int)
, isUnicodeIdentifierStart(int)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierPart(char ch)
Символ может быть частью идентификатора Java, если какое-либо следующее является истиной:
'$'
) '_'
) isIdentifierIgnorable
возвраты true
для символа Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isJavaIdentifierPart(int)
метод.
ch
- символ, который будет протестирован.true
если символ может быть частью идентификатора Java; false
иначе.isIdentifierIgnorable(char)
, isJavaIdentifierStart(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierPart(char)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierPart(int codePoint)
Символ может быть частью идентификатора Java, если какое-либо следующее является истиной:
'$'
) '_'
) isIdentifierIgnorable(codePoint)
возвраты true
для символа codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ может быть частью идентификатора Java; false
иначе.isIdentifierIgnorable(int)
, isJavaIdentifierStart(int)
, isLetterOrDigit(int)
, isUnicodeIdentifierPart(int)
, SourceVersion.isIdentifier(CharSequence)
public static boolean isUnicodeIdentifierStart(char ch)
Символ может запустить идентификатор Unicode, если и только если одно из следующих условий является истиной:
isLetter(ch)
возвраты true
getType(ch)
возвраты LETTER_NUMBER
. Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isUnicodeIdentifierStart(int)
метод.
ch
- символ, который будет протестирован.true
если символ может запустить идентификатор Unicode; false
иначе.isJavaIdentifierStart(char)
, isLetter(char)
, isUnicodeIdentifierPart(char)
public static boolean isUnicodeIdentifierStart(int codePoint)
Символ может запустить идентификатор Unicode, если и только если одно из следующих условий является истиной:
isLetter(codePoint)
возвраты true
getType(codePoint)
возвраты LETTER_NUMBER
. codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ может запустить идентификатор Unicode; false
иначе.isJavaIdentifierStart(int)
, isLetter(int)
, isUnicodeIdentifierPart(int)
public static boolean isUnicodeIdentifierPart(char ch)
Символ может быть частью идентификатора Unicode, если и только если один из следующих операторов является истиной:
'_'
) isIdentifierIgnorable
возвраты true
для этого символа. Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isUnicodeIdentifierPart(int)
метод.
ch
- символ, который будет протестирован.true
если символ может быть частью идентификатора Unicode; false
иначе.isIdentifierIgnorable(char)
, isJavaIdentifierPart(char)
, isLetterOrDigit(char)
, isUnicodeIdentifierStart(char)
public static boolean isUnicodeIdentifierPart(int codePoint)
Символ может быть частью идентификатора Unicode, если и только если один из следующих операторов является истиной:
'_'
) isIdentifierIgnorable
возвраты true
для этого символа. codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ может быть частью идентификатора Unicode; false
иначе.isIdentifierIgnorable(int)
, isJavaIdentifierPart(int)
, isLetterOrDigit(int)
, isUnicodeIdentifierStart(int)
public static boolean isIdentifierIgnorable(char ch)
Следующие символы Unicode являются игнорируемыми в идентификаторе Java или идентификаторе Unicode:
'\u0000'
через '\u0008'
'\u000E'
через '\u001B'
'\u007F'
через '\u009F'
FORMAT
общее значение категории Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isIdentifierIgnorable(int)
метод.
ch
- символ, который будет протестирован.true
если символ является игнорируемым управляющим символом, который может быть частью идентификатора Unicode или Java; false
иначе.isJavaIdentifierPart(char)
, isUnicodeIdentifierPart(char)
public static boolean isIdentifierIgnorable(int codePoint)
Следующие символы Unicode являются игнорируемыми в идентификаторе Java или идентификаторе Unicode:
'\u0000'
через '\u0008'
'\u000E'
через '\u001B'
'\u007F'
через '\u009F'
FORMAT
общее значение категории codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является игнорируемым управляющим символом, который может быть частью идентификатора Unicode или Java; false
иначе.isJavaIdentifierPart(int)
, isUnicodeIdentifierPart(int)
public static char toLowerCase(char ch)
Отметьте это Character.isLowerCase(Character.toLowerCase(ch))
не всегда возвращается true
для некоторых диапазонов символов, особенно те, которые являются символами или идеограммами.
Вообще, String.toLowerCase()
должен использоваться, чтобы отобразить символы на нижний регистр. String
методы отображения случая обладают несколькими преимуществами Character
методы отображения случая. String
методы отображения случая могут выполнить чувствительные к локали отображения, контекстно-зависимые отображения, и 1:M символьные отображения, тогда как Character
методы отображения случая не могут.
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование toLowerCase(int)
метод.
ch
- символ, который будет преобразован.isLowerCase(char)
, String.toLowerCase()
public static int toLowerCase(int codePoint)
Отметьте это Character.isLowerCase(Character.toLowerCase(codePoint))
не всегда возвращается true
для некоторых диапазонов символов, особенно те, которые являются символами или идеограммами.
Вообще, String.toLowerCase()
должен использоваться, чтобы отобразить символы на нижний регистр. String
методы отображения случая обладают несколькими преимуществами Character
методы отображения случая. String
методы отображения случая могут выполнить чувствительные к локали отображения, контекстно-зависимые отображения, и 1:M символьные отображения, тогда как Character
методы отображения случая не могут.
codePoint
- символ (кодовая точка Unicode), чтобы быть преобразованным.isLowerCase(int)
, String.toLowerCase()
public static char toUpperCase(char ch)
Отметьте это Character.isUpperCase(Character.toUpperCase(ch))
не всегда возвращается true
для некоторых диапазонов символов, особенно те, которые являются символами или идеограммами.
Вообще, String.toUpperCase()
должен использоваться, чтобы отобразить символы на верхний регистр. String
методы отображения случая обладают несколькими преимуществами Character
методы отображения случая. String
методы отображения случая могут выполнить чувствительные к локали отображения, контекстно-зависимые отображения, и 1:M символьные отображения, тогда как Character
методы отображения случая не могут.
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование toUpperCase(int)
метод.
ch
- символ, который будет преобразован.isUpperCase(char)
, String.toUpperCase()
public static int toUpperCase(int codePoint)
Отметьте это Character.isUpperCase(Character.toUpperCase(codePoint))
не всегда возвращается true
для некоторых диапазонов символов, особенно те, которые являются символами или идеограммами.
Вообще, String.toUpperCase()
должен использоваться, чтобы отобразить символы на верхний регистр. String
методы отображения случая обладают несколькими преимуществами Character
методы отображения случая. String
методы отображения случая могут выполнить чувствительные к локали отображения, контекстно-зависимые отображения, и 1:M символьные отображения, тогда как Character
методы отображения случая не могут.
codePoint
- символ (кодовая точка Unicode), чтобы быть преобразованным.isUpperCase(int)
, String.toUpperCase()
public static char toTitleCase(char ch)
char
параметром уже является titlecase char
, то же самое char
значение будет возвращено. Отметьте это Character.isTitleCase(Character.toTitleCase(ch))
не всегда возвращается true
для некоторых диапазонов символов.
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование toTitleCase(int)
метод.
ch
- символ, который будет преобразован.isTitleCase(char)
, toLowerCase(char)
, toUpperCase(char)
public static int toTitleCase(int codePoint)
Отметьте это Character.isTitleCase(Character.toTitleCase(codePoint))
не всегда возвращается true
для некоторых диапазонов символов.
codePoint
- символ (кодовая точка Unicode), чтобы быть преобразованным.isTitleCase(int)
, toLowerCase(int)
, toUpperCase(int)
public static int digit(char ch, int radix)
ch
в указанном основании. Если основание не находится в диапазоне MIN_RADIX
≤ radix
≤ MAX_RADIX
или если значение ch
не допустимая цифра в указанном основании, -1
возвращается. Символ является допустимой цифрой, если по крайней мере одно из следующего является истиной:
isDigit
true
из символа и значения десятичной цифры Unicode символа (или его одно-символьное разложение) меньше чем указанное основание. В этом случае значение десятичной цифры возвращается. 'A'
через 'Z'
и его код является меньше чем radix + 'A' - 10
. В этом случае, ch - 'A' + 10
возвращается. 'a'
через 'z'
и его код является меньше чем radix + 'a' - 10
. В этом случае, ch - 'a' + 10
возвращается. '\uFF21'
) через Z ('\uFF3A'
) и его код является меньше чем radix + '\uFF21' - 10
. В этом случае, ch - '\uFF21' + 10
возвращается. '\uFF41'
) через z ('\uFF5A'
) и его код является меньше чем radix + '\uFF41' - 10
. В этом случае, ch - '\uFF41' + 10
возвращается. Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование digit(int, int)
метод.
ch
- символ, который будет преобразован.radix
- основание.forDigit(int, int)
, isDigit(char)
public static int digit(int codePoint, int radix)
Если основание не находится в диапазоне MIN_RADIX
≤ radix
≤ MAX_RADIX
или если символ не является допустимой цифрой в указанном основании, -1
возвращается. Символ является допустимой цифрой, если по крайней мере одно из следующего является истиной:
isDigit(codePoint)
true
из символа и значения десятичной цифры Unicode символа (или его одно-символьное разложение) меньше чем указанное основание. В этом случае значение десятичной цифры возвращается. 'A'
через 'Z'
и его код является меньше чем radix + 'A' - 10
. В этом случае, codePoint - 'A' + 10
возвращается. 'a'
через 'z'
и его код является меньше чем radix + 'a' - 10
. В этом случае, codePoint - 'a' + 10
возвращается. '\uFF21'
) через Z ('\uFF3A'
) и его код является меньше чем radix + '\uFF21' - 10
. В этом случае, codePoint - '\uFF21' + 10
возвращается. '\uFF41'
) через z ('\uFF5A'
) и его код является меньше чем radix + '\uFF41'- 10
. В этом случае, codePoint - '\uFF41' + 10
возвращается. codePoint
- символ (кодовая точка Unicode), чтобы быть преобразованным.radix
- основание.forDigit(int, int)
, isDigit(int)
public static int getNumericValue(char ch)
int
значение, которое представляет указанный символ Unicode. Например, символ '\u216C'
(римская цифра пятьдесят), возвратит интервал со значением 50. Буквы A-Z в их верхнем регистре ('\u0041'
через '\u005A'
), нижний регистр ('\u0061'
через '\u007A'
), и полная разновидность width ('\uFF21'
через '\uFF3A'
и '\uFF41'
через '\uFF5A'
) у форм есть числовые значения от 10 до 35. Это независимо от спецификации Unicode, которая не присваивает числовые значения им char
значения.
Если у символа нет числового значения, то-1 возвращается. Если у символа есть числовое значение, которое не может быть представлено как неотрицательное целое число (например, дробное значение), то-2 возвращается.
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование getNumericValue(int)
метод.
ch
- символ, который будет преобразован.int
значение;-2, если у символа есть числовое значение, которое не является неотрицательным целым числом;-1, если у символа нет никакого числового значения.forDigit(int, int)
, isDigit(char)
public static int getNumericValue(int codePoint)
int
значение, которое представляет указанный символ (кодовая точка Unicode). Например, символ '\u216C'
(Римская цифра пятьдесят), возвратится int
со значением 50. Буквы A-Z в их верхнем регистре ('\u0041'
через '\u005A'
), нижний регистр ('\u0061'
через '\u007A'
), и полная разновидность width ('\uFF21'
через '\uFF3A'
и '\uFF41'
через '\uFF5A'
) у форм есть числовые значения от 10 до 35. Это независимо от спецификации Unicode, которая не присваивает числовые значения им char
значения.
Если у символа нет числового значения, то-1 возвращается. Если у символа есть числовое значение, которое не может быть представлено как неотрицательное целое число (например, дробное значение), то-2 возвращается.
codePoint
- символ (кодовая точка Unicode), чтобы быть преобразованным.int
значение;-2, если у символа есть числовое значение, которое не является неотрицательным целым числом;-1, если у символа нет никакого числового значения.forDigit(int, int)
, isDigit(int)
@Deprecated public static boolean isSpace(char ch)
true
для следующих пяти символов только: '\t' | U+0009 |
HORIZONTAL TABULATION |
'\n' | U+000A |
NEW LINE |
'\f' | U+000C |
FORM FEED |
'\r' | U+000D |
CARRIAGE RETURN |
' ' | U+0020 |
SPACE |
ch
- символ, который будет протестирован.true
если символ является пробелом ISO-LATIN-1; false
иначе.isSpaceChar(char)
, isWhitespace(char)
public static boolean isSpaceChar(char ch)
SPACE_SEPARATOR
LINE_SEPARATOR
PARAGRAPH_SEPARATOR
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isSpaceChar(int)
метод.
ch
- символ, который будет протестирован.true
если символ является пробелом; false
иначе.isWhitespace(char)
public static boolean isSpaceChar(int codePoint)
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является пробелом; false
иначе.isWhitespace(int)
public static boolean isWhitespace(char ch)
SPACE_SEPARATOR
, LINE_SEPARATOR
, или PARAGRAPH_SEPARATOR
) но не также неразрывный пробел ('\u00A0'
, '\u2007'
, '\u202F'
). '\t'
, ГОРИЗОНТАЛЬНАЯ ТАБУЛЯЦИЯ U+0009. '\n'
, ПЕРЕВОД СТРОКИ U+000A. '\u000B'
, ВЕРТИКАЛЬНАЯ ТАБУЛЯЦИЯ U+000B. '\f'
, ПЕРЕВОД ФОРМАТА U+000C. '\r'
, ВОЗВРАТ КАРЕТКИ U+000D. '\u001C'
, РАЗДЕЛИТЕЛЬ ФАЙЛОВ U+001C. '\u001D'
, РАЗДЕЛИТЕЛЬ ГРУППЫ U+001D. '\u001E'
, РАЗДЕЛИТЕЛЬ ЗАПИСЕЙ U+001E. '\u001F'
, РАЗДЕЛИТЕЛЬ МОДУЛЯ U+001F. Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isWhitespace(int)
метод.
ch
- символ, который будет протестирован.true
если символ является пробельным символом Java; false
иначе.isSpaceChar(char)
public static boolean isWhitespace(int codePoint)
SPACE_SEPARATOR
, LINE_SEPARATOR
, или PARAGRAPH_SEPARATOR
) но не также неразрывный пробел ('\u00A0'
, '\u2007'
, '\u202F'
). '\t'
, ГОРИЗОНТАЛЬНАЯ ТАБУЛЯЦИЯ U+0009. '\n'
, ПЕРЕВОД СТРОКИ U+000A. '\u000B'
, ВЕРТИКАЛЬНАЯ ТАБУЛЯЦИЯ U+000B. '\f'
, ПЕРЕВОД ФОРМАТА U+000C. '\r'
, ВОЗВРАТ КАРЕТКИ U+000D. '\u001C'
, РАЗДЕЛИТЕЛЬ ФАЙЛОВ U+001C. '\u001D'
, РАЗДЕЛИТЕЛЬ ГРУППЫ U+001D. '\u001E'
, РАЗДЕЛИТЕЛЬ ЗАПИСЕЙ U+001E. '\u001F'
, РАЗДЕЛИТЕЛЬ МОДУЛЯ U+001F. codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является пробельным символом Java; false
иначе.isSpaceChar(int)
public static boolean isISOControl(char ch)
'\u0000'
через '\u001F'
или в диапазоне '\u007F'
через '\u009F'
. Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isISOControl(int)
метод.
ch
- символ, который будет протестирован.true
если символ является управляющим символом ISO; false
иначе.isSpaceChar(char)
, isWhitespace(char)
public static boolean isISOControl(int codePoint)
'\u0000'
через '\u001F'
или в диапазоне '\u007F'
через '\u009F'
.codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ является управляющим символом ISO; false
иначе.isSpaceChar(int)
, isWhitespace(int)
public static int getType(char ch)
Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование getType(int)
метод.
ch
- символ, который будет протестирован.int
представление общей категории символа.COMBINING_SPACING_MARK
, CONNECTOR_PUNCTUATION
, CONTROL
, CURRENCY_SYMBOL
, DASH_PUNCTUATION
, DECIMAL_DIGIT_NUMBER
, ENCLOSING_MARK
, END_PUNCTUATION
, FINAL_QUOTE_PUNCTUATION
, FORMAT
, INITIAL_QUOTE_PUNCTUATION
, LETTER_NUMBER
, LINE_SEPARATOR
, LOWERCASE_LETTER
, MATH_SYMBOL
, MODIFIER_LETTER
, MODIFIER_SYMBOL
, NON_SPACING_MARK
, OTHER_LETTER
, OTHER_NUMBER
, OTHER_PUNCTUATION
, OTHER_SYMBOL
, PARAGRAPH_SEPARATOR
, PRIVATE_USE
, SPACE_SEPARATOR
, START_PUNCTUATION
, SURROGATE
, TITLECASE_LETTER
, UNASSIGNED
, UPPERCASE_LETTER
public static int getType(int codePoint)
codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.int
представление общей категории символа.COMBINING_SPACING_MARK
, CONNECTOR_PUNCTUATION
, CONTROL
, CURRENCY_SYMBOL
, DASH_PUNCTUATION
, DECIMAL_DIGIT_NUMBER
, ENCLOSING_MARK
, END_PUNCTUATION
, FINAL_QUOTE_PUNCTUATION
, FORMAT
, INITIAL_QUOTE_PUNCTUATION
, LETTER_NUMBER
, LINE_SEPARATOR
, LOWERCASE_LETTER
, MATH_SYMBOL
, MODIFIER_LETTER
, MODIFIER_SYMBOL
, NON_SPACING_MARK
, OTHER_LETTER
, OTHER_NUMBER
, OTHER_PUNCTUATION
, OTHER_SYMBOL
, PARAGRAPH_SEPARATOR
, PRIVATE_USE
, SPACE_SEPARATOR
, START_PUNCTUATION
, SURROGATE
, TITLECASE_LETTER
, UNASSIGNED
, UPPERCASE_LETTER
public static char forDigit(int digit, int radix)
radix
не допустимое основание, или значение digit
не допустимая цифра в указанном основании, нулевой символ ('\u0000'
) возвращается. radix
параметр допустим, если это больше чем или равно MIN_RADIX
и меньше чем или равный MAX_RADIX
. digit
параметр допустим если 0 <= digit < radix
.
Если цифра - меньше чем 10, то '0' + digit
возвращается. Иначе, значение 'a' + digit - 10
возвращается.
digit
- число, чтобы преобразовать в символ.radix
- основание.char
представление указанной цифры в указанном основании.MIN_RADIX
, MAX_RADIX
, digit(char, int)
public static byte getDirectionality(char ch)
char
значения DIRECTIONALITY_UNDEFINED
. Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование getDirectionality(int)
метод.
ch
- char
на который требуют свойство направленности.char
значение.DIRECTIONALITY_UNDEFINED
, DIRECTIONALITY_LEFT_TO_RIGHT
, DIRECTIONALITY_RIGHT_TO_LEFT
, DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
, DIRECTIONALITY_EUROPEAN_NUMBER
, DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
, DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
, DIRECTIONALITY_ARABIC_NUMBER
, DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
, DIRECTIONALITY_NONSPACING_MARK
, DIRECTIONALITY_BOUNDARY_NEUTRAL
, DIRECTIONALITY_PARAGRAPH_SEPARATOR
, DIRECTIONALITY_SEGMENT_SEPARATOR
, DIRECTIONALITY_WHITESPACE
, DIRECTIONALITY_OTHER_NEUTRALS
, DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
, DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
, DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
, DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
, DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static byte getDirectionality(int codePoint)
DIRECTIONALITY_UNDEFINED
.codePoint
- символ (кодовая точка Unicode), на который требуют свойство направленности.DIRECTIONALITY_UNDEFINED
, DIRECTIONALITY_LEFT_TO_RIGHT
, DIRECTIONALITY_RIGHT_TO_LEFT
, DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
, DIRECTIONALITY_EUROPEAN_NUMBER
, DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
, DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
, DIRECTIONALITY_ARABIC_NUMBER
, DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
, DIRECTIONALITY_NONSPACING_MARK
, DIRECTIONALITY_BOUNDARY_NEUTRAL
, DIRECTIONALITY_PARAGRAPH_SEPARATOR
, DIRECTIONALITY_SEGMENT_SEPARATOR
, DIRECTIONALITY_WHITESPACE
, DIRECTIONALITY_OTHER_NEUTRALS
, DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
, DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
, DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
, DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
, DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static boolean isMirrored(char ch)
'\u0028'
ЛЕВАЯ КРУГЛАЯ СКОБКА семантически определяется, чтобы быть вводной круглой скобкой. Это появится как" (" в тексте, который является слева направо, но как")", в тексте, который является справа налево. Отметьте: Этот метод не может обработать дополнительные символы. Поддерживать все символы Unicode, включая дополнительные символы, использование isMirrored(int)
метод.
ch
- char
на который требуют зеркально отраженное свойствоtrue
если случайная работа зеркально отражается, false
если char
не зеркально отражается или не определяется.public static boolean isMirrored(int codePoint)
'\u0028'
ЛЕВАЯ КРУГЛАЯ СКОБКА семантически определяется, чтобы быть вводной круглой скобкой. Это появится как" (" в тексте, который является слева направо, но как")", в тексте, который является справа налево.codePoint
- символ (кодовая точка Unicode), чтобы быть протестированным.true
если символ зеркально отражается, false
если символ не зеркально отражается или не определяется.public int compareTo(Character anotherCharacter)
Character
объекты в цифровой форме.compareTo
в интерфейсе Comparable<Character>
anotherCharacter
- Character
быть сравненным.0
если параметр Character
равно этому Character
; значение меньше чем 0
если это Character
в цифровой форме меньше чем Character
параметр; и значение, больше чем 0
если это Character
в цифровой форме больше чем Character
параметр (сравнение без знака). Отметьте, что это - строго числовое сравнение; это не зависимо от локали.public static int compare(char x, char y)
char
значения в цифровой форме. Возвращенное значение идентично тому, что было бы возвращено: Character.valueOf(x).compareTo(Character.valueOf(y))
x
- первое char
сравнитьсяy
- второе char
сравниться0
если x == y
; значение меньше чем 0
если x < y
; и значение, больше чем 0
если x > y
public static char reverseBytes(char ch)
public static String getName(int codePoint)
codePoint
, или нуль, если кодовая точка unassigned
. Отметьте: если указанный символ не присваивается имя файлом UnicodeData (часть Базы данных Символа Unicode, сохраняемой Консорциумом Unicode), возвращенное имя является тем же самым как результатом выражения.
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ENGLISH);
codePoint
- символ (кодовая точка Unicode)IllegalArgumentException
- если указанное codePoint
не допустимая кодовая точка Unicode.
Для дальнейшей ссылки API и документации разработчика, см. Java Документация SE. Та документация содержит более подробные, предназначенные разработчиком описания, с концептуальными краткими обзорами, определениями сроков, обходных решений, и рабочих примеров кода.
Авторское право © 1993, 2013, Oracle и/или его филиалы. Все права защищены.
Проект сборка-b92