Глоссарий
- AIAT
Посмотрите Apple Information Access Toolkit (AIAT).
- Apple Information Access Toolkit (AIAT)
В Классическом Mac OS, объектно-ориентированный механизм доступа к информации, содержавший набор инструментов для индексации, поиска и анализа больших объемов документов. Поисковый Набор является реализацией OS X AIAT. AIAT был раньше известен его V-близнецу кодового названия.
- Булев поиск
Соответствие строки запроса к индексируемым условиям с помощью булевых (логических) операторов такой как
AND
иOR
между условиями запроса, дополнительно используя группирующийся для приоритета с помощью круглых скобок. Все выражение запроса является соответствующим. См. также поиск. - компактный
Сделать индекс меньшим путем удаления неиспользованных битов. В течение долгого времени, поскольку документы добавляются к и удалили из индекса, диск индекса или объем потребляемой памяти могут расти вследствие фрагментации. Поисковый Набор включает APIs, чтобы проверить на фрагментацию и уплотнить индекс. См. также фрагментацию.
- корпуса
Форма множественного числа корпуса.
- корпус
Набор одного или более документов, обычно связанных и доступных информационно-поисковой системе. Множественное число: корпуса.
- документ
В целом, в частности locatable информационный объект полезной гранулярности и произвольной структуры. В Поисковом Наборе, что-либо, что содержит текст и что Поисковое клиентское приложение Набора адресуется как документ — документ RTF, файл PDF, Сообщение электронной почты, запись Адресной книги, содержание в Интернете URL, результат запроса базы данных, и т.д. См. также документ объект URL.
- коллекция документов
Посмотрите корпус.
- иерархия объекта документа
Набор документов, в которых каждый документ существует в расположении относительно корневого документа. Расположения могут, может быть реальным, как в файловой системе, или виртуальный.
- документ объект URL
URL к документу. В Поисковом Наборе документ объект URL включает схему, родительский документ объект URL и имя, с форматом каждого компонента, определенного клиентским приложением. Поисковый документ Набора объекты URL может быть преобразован в или от объектов CFURL. См. также документ, породите документ объект URL, схема.
- фрагментация
В Поисковом Наборе, нежелательном увеличении индексного размера вследствие накопления неиспользованной способности. В течение долгого времени, поскольку документы добавляются к и удалили из индекса, индекс может стать фрагментированным — его учредительные документы и условия могут стать расположенными способом, включающим существенное количество неиспользуемого диска или пространства памяти. См. также компактный.
- результат включения/исключения
Посмотрите, что ищет включение/исключение.
- поиск включения/исключения
Неоцениваемый поиск, где результат просто включает документы, соответствующие запрос и исключающие не делающие документы. Поиски включения/исключения имеют тенденцию быть быстрее, чем оцениваемые поиски. Поисковый Набор поддерживает поиски включения/исключения. См. также основанный на уместности результат.
- индекс
Память - или основанный на файле последовательный набор условий в одном или более документах. В дополнение к условиям Поисковые индексы Набора содержат контекстную информацию, указывающую, какие документы каждый срок принадлежит, вместе со сроком и метаданными документа, полезными во время дисплея результатов поиска. Поисковый Набор выполняет свой поиск и анализ индексов. См. также инвертированный индекс; инвертировано-векторный индекс; векторный индекс
- индексная группа
Недолгий набор одного или более индексов; цель поиска. Индексная группа соответствует одному или более аспектам корпуса документов, которые Вы хотите искать. Например, один индекс в группе мог бы содержать заголовки документов, в то время как другой содержит основной текст тех тех же документов. Индексная группа может также включить индексы многократных корпусов. См. также корпус; документ.
- информационный поиск (IR)
Процесс располагающейся информации на основе четко определенной информационной потребности. Информационно-поисковая система состоит из корпуса, одного или более индексов его содержания, интерфейса запросов, поисковой системы и интерфейса результатов. См. также корпус; поиск.
- инвертированный индекс
Индекс, содержащий условия, как ключи, отобразился на ссылки на документы, в которых они появляются. Индекс сортируется его ключами. «Инвертированный» означает, что документы найдены путем соответствия на условиях, а не наоборот. См. также индекс; инвертировано-векторный индекс; векторный индекс
- инвертировано-векторный индекс
Индекс, содержащий условия, отобразился для документирования объектов URL, представляющих документы, что условия появляются в, а также документ объекты URL, отображенные на условиях, которые содержит каждый документ. См. также индекс; инвертированный индекс; векторный индекс.
- IR
Посмотрите информационный поиск (IR).
- MIME вводит подсказку
Консультативная метаинформация, предлагающая вероятный тип контента для URL. MIME является акронимом для Многоцелевых расширений почты в Интернете. В Поисковом Наборе общие подсказки типа MIME включают
text/plain
,text/rtf
,text/html
,text/pdf
, иapplication/msword
. - частота минимального срока
Наименьшее количество числа раз срок может появиться в документе и все еще быть индексировано. Эта функциональность в настоящее время не поддерживается Поисковыми индексами Набора.
- длина минимального срока
Самый короткий срок для индексации. Когда Поиск, Кит добавляет условия от документа до индекса, это перескакивает через слова, длина которых короче, чем длина минимального срока.
- имя
В Поисковом Наборе, название документа, как представлено в документе объект URL. Для документов, которые являются дисковыми файлами, имя должно соответствовать фактическому имени файла. Для других типов документов Ваше приложение может присвоить любое имя к документу. См. также документ объект URL
- оператор
Символ или слово, имеющее особое значение, когда используется в запросе. Операторы в Поисковом Наборе включают
AND
,OR
,NOT
, круглые скобки, кавычки и несколько других. Поисковый Набор интерпретирует операторов и определяет намеченный поисковый тип пользователя согласно значениям операторов. - родительский документ объект URL
В Поисковом Наборе, для основанных на файле документов, расположения папки включения для документа или для другого родительского документа объект URL. Поисковый Набор управляет документами с помощью отношений отцов и детей, не путей. Можно создать путь любого документа следующим его родительские ссылки на документ. См. также документ объект URL.
- частичный поиск строки
Соответствие условий в строке запроса к индексируемым условиям, с подразумеваемыми подстановочными символами в запуске и конце каждого срока запроса. Каждый срок является соответствующим отдельно. Поисковый Набор в настоящее время не поддерживает частичный поиск строки как опцию, но клиентское приложение может обеспечить его путем добавления подстановочных операторов (звездочки) вокруг каждого срока перед передаванием запроса для Поиска Набора. См. также поиск.
- поиск фразы
Соответствие строки запроса к индексируемым условиям, со строкой запроса, которую рассматривают как полную фразу. Когда точная фраза запроса появляется в документе, соответствие происходит. Поисковый Набор поддерживает фразу, ищущую в инвертированных и инвертировано-векторных индексах. См. также поиск.
- префиксный поиск
Специализированный тип поиска подстроки. Префиксный поиск включает соответствие срока в строке запроса к индексируемым условиям с явным подстановочным символом в конце срока запроса. Когда символы в сроке запроса (минус подстановочный символ) соответствуют начало индексируемого срока, соответствие происходит. Например, строка запроса
car*
будет соответствоватьcar
,carpet
, иcarnivore
. Поисковый Набор поддерживает префикс, ищущий в инвертированных и инвертировано-векторных индексах. См. также поиск; поиск подстроки; подстановочный символ. - запрос
(n). Текстовая строка, содержа условия и операторов, который представляет запрос информационного поиска пользователя. Различные типы запроса, поддерживаемого Поисковым Набором, включают простой, префикс/суффикс/подстрока, булевская переменная, фраза и подобие. (v). Вызвать запрос информации в информационно-поисковой системе. См. также поиск.
- оцениваемый поиск
Посмотрите основанный на уместности результат.
- основанный на уместности результат
См. также основанный на уместности поиск.
- основанный на уместности поиск
Оцениваемый поиск, результат которого включает оценку уместности для каждого документа, соответствующего запрос. В целом оценки уместности могут быть нормализованы к 100% или ненормализованы. Поисковый Набор поддерживает только ненормализованные результаты. См. также поиск включения/исключения; поиск.
- корневое слово
Посмотрите основу.
- схема
Способ получить доступ к файловой системе или интернет-ресурсу, соответствуя протоколу доступа. Примеры включают
http
,ftp
, иfile
. См. также документ объект URL. - поиск
В информационно-поисковой системе, процесс, пытающийся определить местоположение документов, соответствующих запрос, и это может присвоить очки уместности найденным документам. На успешное соответствие поисковая система возвращает ссылки на найденные документы. Поисковый Набор поддерживает множество поисковых типов, некоторые из которых могут быть объединены. Эти типы являются простыми, булевыми, оценены, неоцениваемые, фраза, подобие, префикс, суффикс и подстрока.
- поисковый объект
В Поисковом Наборе, непрозрачный тип данных, представляющий асинхронный поиск и содержащий его результаты, накопленные, поскольку они найдены. Поисковый объект имеет тип
SKSearchRef
. - поиск подобия
Соответствие строки запроса, обычно состоящей из представительной части документа, к индексируемым документам. Когда Поисковый Набор определяет значительное подобие содержания между запросом и индексируемым документом, соответствие происходит. Поисковый Набор поддерживает подобие, ищущее в векторных и инвертировано-векторных индексах. Подобие, ищущее также, работает в инвертированных индексах в Поисковом Наборе, но производительность хуже. См. также поиск.
- простой поиск
Соответствуя условий в строке запроса к индексируемым условиям, использующим точный, соответствие символа для символа. Каждый срок является соответствующим отдельно. В Поисковом Наборе, по умолчанию, пробелы между условиями ведут себя как булевская переменная
AND
операторы. См. также поиск. - основа
Корень семьи морфологических или флективных вариантов слова. Например, «плавание» является основой «пловца», «плавания», и «плавало».
- стемминг
Основанное на алгоритме удаление морфологических и флективных компонентов слова, обычно окончания. Языковозависимый. Стемминг иногда упоминается как отсечение суффиксов, несмотря на то, что некоторые алгоритмы стемминга выполняют префикс, разделяющий также. Системное использование IR, происходящее, чтобы повысить поисковое качество и сократить индексный размер. Поисковый Набор не поддерживает стемминг; в случае необходимости клиентские приложения реализуют его. Некоторые алгоритмы стемминга обрабатывают только регулярные варианты, такие как преобразование «плавания», чтобы «плавать», и сделать не обрабатывают неправильные варианты, такие как преобразование «плавал» для «плавания».
- стоп-слово
Слово для не индексации. Когда Поиск, Кит добавляет условия от документа до индекса, это перескакивает через слова в своем главном списке слов.
- поиск подстроки
Соответствие срока в строке запроса к индексируемым условиям, с явными подстановочными символами в запуске и конце срока запроса. Когда символы в сроке запроса (минус подстановочные символы) соответствуют начало, окончание, или середина индексируемого срока, соответствие происходит. Например, строка запроса
*cat*
будет соответствоватьcat
,concatenate
,tomcat
, иcattle
. Поисковый Набор поддерживает подстроку, ищущую в инвертированных и инвертировано-векторных индексах. См. также поиск. - суффиксный поиск
Специализированный тип поиска подстроки. Суффиксный поиск включает соответствие срока в строке запроса к индексируемым условиям с явным подстановочным символом в начале срока запроса. Когда символы в сроке запроса (минус подстановочный символ) соответствуют окончание индексируемого срока, соответствие происходит. Например, строка запроса
*ion
будет соответствоватьion
,lion
, иversion
. Поисковый Набор поддерживает суффикс, ищущий в инвертированных и инвертировано-векторных индексах. См. также поиск; подстановочный символ. - отсечение суффиксов
Посмотрите стемминг.
- объект реферирования
В Поисковом Наборе, непрозрачный тип данных, представляющий информацию о реферировании, включая сводный текст. Объект реферирования имеет тип
SKSummaryRef
. - синоним
Срок, который система IR считает эквивалентным другому сроку и для индексации и для запросов. Например, система IR могла определить «автомобиль», «пассажирский механизм» и «автомобиль», чтобы быть синонимами. См. также информационный поиск (IR); индекс; запрос.
- срок
Атомарная запись в Поисковом индексе Набора, обычно соответствуя слову найдена в одном из документов индекса.
- извлечение текста
Выборочное копирование условий из одного или более документов в индекс. См. также стемминг; стоп-слово.
- неоцениваемый поиск
Посмотрите, что ищет включение/исключение.
- URL
Унифицированный указатель ресурсов. Интернет-адрес или файловая система соединяет каналом, когда отформатировано как URL со схемой. См. также схему.
- V-близнец
Посмотрите Apple Information Access Toolkit (AIAT).
- векторный индекс
Индекс, содержащий документ, который объекты URL, как ключи, отобразили на условия, которые содержит каждый документ. См. также индекс; инвертированный индекс; инвертировано-векторный индекс
- подстановочный символ
Оператор использовал в запросе, указывающем соответствие на любом символе. В Поисковом Наборе подстановочный символ является звездочкой. В зависимости от использования подстановочный символ может указать префикс, суффикс или поиск подстроки. См. также оператора; запрос.