Spec-Zone .ru
спецификации, руководства, описания, API
|
Character
class инкапсулирует char
тип данных. Для выпуска 5 J2SE много методов были добавлены к Character
class, чтобы поддерживать дополнительные символы. Этот API попадает в две категории: методы, которые преобразовывают между char
и значения кодовой точки и методы, что verifiy законность или кодовые точки карты.
Этот раздел описывает подмножество доступных методов в Character
class. Для полного списка доступных API см. Character
Спецификация class.
Следующая таблица включает самые полезные методы преобразования, или методы, которые облегчают преобразование, в Character
class. codePointAt
и codePointBefore
методы включаются в этот список, потому что текст обычно находится в последовательности, такой как a String
, и эти методы могут использоваться, чтобы извлечь требуемую подстроку.
Метод (ы) | Описание |
---|---|
toChars(int codePoint, char[] dst, int dstIndex) toChars(int codePoint) |
Преобразовывает указанную кодовую точку Unicode в ее представление UTF-16 и помещает это в a char массив. Демонстрационное использование: Character.toChars(0x10400) |
toCodePoint(char high, char low) toCodePoint(CharSequence, int) toCodePoint(char[], int, int) |
Преобразовывает указанные параметры в его дополнительное значение кодовой точки. Различные методы принимают различные входные форматы. |
codePointAt(char[] a, int index) codePointAt(char[] a, int index, int limit) codePointAt(CharSequence seq, int index) |
Возвращается кодовая точка Unicode в указанном индексируют. Третий метод берет a CharSequence и второй метод осуществляет верхний предел индексирования. |
codePointBefore(char[] a, int index) codePointBefore(char[] a, int index, int start) codePointBefore(CharSequence seq, int index) codePointBefore(char[], int, int) |
Возвращает кодовую точку Unicode прежде, чем указанные индексируют. Третий метод принимает a CharSequence и другие методы принимают a char массив. Второй метод осуществляет более низкий предел на индексировании. |
charCount(int codePoint) |
Возвращает значение 1 для символов, которые могут быть представлены синглом char . Возвращает значение 2 для дополнительных символов, которые требуют два char s. |
Некоторые из предыдущих методов, которые использовали char
примитивный тип данных, такой как isLowerCase(char)
и isDigit(char)
, вытеснялись методами, которые поддерживают дополнительные символы, такой как isLowerCase(int)
и isDigit(int)
. Предыдущие методы поддерживаются, но не работают с дополнительными символами. Чтобы создать глобальное приложение и гарантировать, что Ваш код работает легко с любым языком, рекомендуется, чтобы Вы использовали более новые формы этих методов.
Отметьте, что по причинам производительности большинство методов, которые принимают кодовую точку, не проверяет законность параметра кодовой точки. Можно использовать isValidCodePoint
метод с этой целью.
Следующая таблица приводит часть проверки и отображающихся методов в Character
class.
Метод (ы) | Описание |
---|---|
isValidCodePoint(int codePoint) |
Возвращает true, если кодовая точка в пределах диапазона 0x0000 к 0x10FFFF, включительно. |
isSupplementaryCodePoint(int codePoint) |
Возвращает true, если кодовая точка в пределах диапазона 0x10000 к 0x10FFFF, включительно. |
isHighSurrogate(char) |
Возвращает true если указанное char в пределах высокого суррогатного диапазона \uD800 к \uDBFF, включительно. |
isLowSurrogate(char) |
Возвращает true если указанное char в пределах низкого суррогатного диапазона \uDC00 к \uDFFF, включительно. |
isSurrogatePair(char high, char low) |
Возвращает true, если указанные высокие и низкие суррогатные кодовые обозначения представляют допустимую суррогатную пару. |
codePointCount(CharSequence, int, int) codePointCount(char[], int, int) |
Возвращает число кодовых точек Unicode в CharSequence , или char массив. |
isLowerCase(int) isUpperCase(int) |
Возвращает true, если указанная кодовая точка Unicode является символом нижнего регистра или символом верхнего регистра. |
isDefined(int) |
Возвращает true, если указанная кодовая точка Unicode определяется в стандарте Unicode. |
isJavaIdentifierStart(char) isJavaIdentifierStart(int) |
Возвращает true, если указанная кодовая точка символа или Unicode допустима как первый символ в идентификаторе Java. |
isLetter(int) isDigit(int) isLetterOrDigit(int) |
Возвращает true, если указанная кодовая точка Unicode является буквой, цифрой, или буквой или цифрой. |
getDirectionality(int) |
Возвращает свойство направленности Unicode для данной кодовой точки Unicode. |
Character.UnicodeBlock.of(int codePoint) |
Возвращает объект, представляющий блок Unicode, который содержит данную кодовую точку Unicode или возвраты null если кодовая точка не является элементом определенного блока. |
String
, StringBuffer
, и StringBuilder
у классов также есть contructors и методы, которые работают с дополнительными символами. Следующая таблица приводит некоторые из обычно используемых методов. Для полного списка доступных API см. javadoc для String
StringBuffer
StringBuilder