References

SQL команды

Управление схемой
Управление данными
  • INSERT - Добавляет новые документы
  • REPLACE - Заменяет существующие документы новыми
  • REPLACE .. SET - Заменяет одно или несколько полей в таблице
  • UPDATE - Выполняет обновление на месте в документах
  • DELETE - Удаляет документы
  • TRUNCATE TABLE - Удаляет все документы из таблицы
Резервное копирование
  • BACKUP - Создает резервные копии ваших таблиц
SELECT
  • SELECT - Поиск
    • WHERE - Фильтры
    • GROUP BY - Группирует результаты поиска
    • GROUP BY ORDER - Сортирует группы
    • GROUP BY HAVING - Фильтрует группы
    • OPTION - Опции запроса
    • FACET - Фасетный поиск
    • SUB-SELECTS - Об использовании подзапросов SELECT
    • JOIN - Объединение таблиц в SELECT
  • EXPLAIN QUERY - Показывает план выполнения запроса без его запуска
  • SHOW META - Показывает расширенную информацию о выполненном запросе
  • SHOW PROFILE - Показывает профилирование выполненного запроса
  • SHOW PLAN - Показывает план выполнения запроса после его выполнения
  • SHOW WARNINGS - Показывает предупреждения последнего запроса
Сброс различных вещей
  • FLUSH ATTRIBUTES - Принудительно сбрасывает обновленные атрибуты на диск
  • FLUSH HOSTNAMES - Обновляет IP-адреса, связанные с именами хостов агентов
  • FLUSH LOGS - Инициирует переоткрытие файлов логов searchd и запросов (аналогично USR1)
Оптимизация таблиц реального времени
  • FLUSH RAMCHUNK - Принудительно создает новый диск
  • FLUSH TABLE - Сбрасывает RAM-чанк таблицы реального времени на диск
  • OPTIMIZE TABLE - Помещает таблицу реального времени в очередь на оптимизацию
Импорт в таблицу реального времени
  • ATTACH TABLE - Переносит данные из обычной таблицы в таблицу реального времени
  • IMPORT TABLE - Импортирует ранее созданную таблицу RT или PQ в сервер, работающий в режиме RT
Репликация
  • JOIN CLUSTER - Присоединяется к кластеру репликации
  • ALTER CLUSTER - Добавляет/удаляет таблицу в кластере репликации
  • SET CLUSTER - Изменяет настройки кластера репликации
  • DELETE CLUSTER - Удаляет кластер репликации
Вращение простой таблицы
  • RELOAD TABLE - Вращает простую таблицу
  • RELOAD TABLES - Вращает все простые таблицы
Транзакции
  • BEGIN - Начинает транзакцию
  • COMMIT - Завершает транзакцию
  • ROLLBACK - Откатывает транзакцию
CALL
  • CALL SUGGEST, CALL QSUGGEST - Предлагает слова с исправлением орфографии
  • CALL SNIPPETS - Создаёт фрагмент с подсветкой результатов из предоставленных данных и запроса
  • CALL PQ - Выполняет перколяционный запрос
  • CALL KEYWORDS - Используется для проверки токенизации ключевых слов. Также позволяет получить токенизированные формы предоставленных ключевых слов
  • CALL AUTOCOMPLETE - Автозаполняет ваш поисковый запрос
Плагины
Статус сервера
  • SHOW STATUS - Отображает ряд полезных счетчиков производительности
  • SHOW THREADS - Перечисляет все текущие активные потоки клиентов
  • SHOW VARIABLES - Перечисляет переменные сервера и их значения
  • SHOW VERSION - Предоставляет подробную информацию о версиях различных компонентов инстанса.

HTTP эндпоинты

  • /sql - Выполняет SQL-запрос через HTTP JSON
  • /cli - Обеспечивает HTTP интерфейс командной строки
  • /insert - Вставляет документ в таблицу реального времени
  • /pq/tbl_name/doc - Добавляет правило PQ в перколяционную таблицу
  • /update - Обновляет документ в таблице реального времени
  • /replace - Заменяет существующий документ в таблице реального времени или вставляет его, если он не существует
  • /pq/tbl_name/doc/N?refresh=1 - Заменяет правило PQ в перколяционной таблице
  • /delete - Удаляет документ из таблицы
  • /bulk - Выполняет несколько операций вставки, обновления или удаления за один вызов. Подробнее о массовых вставках здесь.
  • /search - Выполняет поиск
  • /search -> knn - Выполняет KNN векторный поиск
  • /pq/tbl_name/search - Выполняет обратный поиск в перколяционной таблице
  • /tbl_name/_mapping - Создаёт схему таблицы в стиле Elasticsearch

Общие сведения

Общие настройки таблиц
Настройки обычных таблиц
Настройки распределенных таблиц
Настройки RT-таблиц

Операторы полнотекстового поиска

Функции

Математические
  • ABS() - Возвращает абсолютное значение
  • ATAN2() - Возвращает арктангенс от двух аргументов
  • BITDOT() - Возвращает сумму произведений каждого бита маски на его вес
  • CEIL() - Возвращает наименьшее целое значение, большее или равное аргументу
  • COS() - Возвращает косинус аргумента
  • CRC32() - Возвращает значение CRC32 аргумента
  • EXP() - Возвращает экспоненту аргумента
  • FIBONACCI() - Возвращает N-е число Фибоначчи, где N - целочисленный аргумент
  • FLOOR() - Возвращает наибольшее целое значение, меньшее или равное аргументу
  • GREATEST() - Принимает JSON/MVA массив в качестве аргумента и возвращает наибольшее значение в этом массиве
  • IDIV() - Возвращает результат целочисленного деления первого аргумента на второй аргумент
  • LEAST() - Принимает JSON/MVA массив в качестве аргумента и возвращает наименьшее значение в этом массиве
  • LN() - Возвращает натуральный логарифм аргумента
  • LOG10() - Возвращает десятичный логарифм аргумента
  • LOG2() - Возвращает двоичный логарифм аргумента
  • MAX() - Возвращает больший из двух аргументов
  • MIN() - Возвращает меньший из двух аргументов
  • POW() - Возвращает первый аргумент, возведенный в степень второго аргумента
  • RAND() - Возвращает случайное число с плавающей точкой от 0 до 1
  • SIN() - Возвращает синус аргумента
  • SQRT() - Возвращает квадратный корень аргумента
Поиск и ранжирование
  • BM25F() - Возвращает точное значение формулы BM25F
  • EXIST() - Заменяет несуществующие столбцы значениями по умолчанию
  • GROUP_CONCAT() - Создает список значений атрибутов всех документов в группе, разделенный запятыми
  • HIGHLIGHT() - Подсвечивает результаты поиска
  • MIN_TOP_SORTVAL() - Возвращает значение ключа сортировки худшего найденного элемента в текущих top-N совпадениях
  • MIN_TOP_WEIGHT() - Возвращает вес худшего найденного элемента в текущих top-N совпадениях
  • PACKEDFACTORS() - Выводит весовые коэффициенты
  • REMOVE_REPEATS() - Удаляет повторяющиеся скорректированные строки с одинаковым значением 'column'
  • WEIGHT() - Возвращает оценку полнотекстового совпадения
  • ZONESPANLIST() - Возвращает пары совпавших зонных интервалов
  • QUERY() - Возвращает текущий полнотекстовый запрос
Преобразование типов
  • BIGINT() - Принудительно преобразует целочисленный аргумент к 64-битному типу
  • DOUBLE() - Принудительно преобразует заданный аргумент к типу с плавающей точкой
  • INTEGER() - Принудительно преобразует заданный аргумент к 64-битному знаковому типу
  • TO_STRING() - Принудительно преобразует аргумент к строковому типу
  • UINT() - Преобразует заданный аргумент к 32-битному беззнаковому целочисленному типу
  • UINT64() - Преобразует заданный аргумент к 64-битному беззнаковому целочисленному типу
  • SINT() - Интерпретирует 32-битное беззнаковое целое как 64-битное знаковое целое
Массивы и условия
  • ALL() - Возвращает 1, если условие истинно для всех элементов массива
  • ANY() - Возвращает 1, если условие истинно для любого элемента массива
  • CONTAINS() - Проверяет, находится ли точка (x,y) внутри заданного полигона
  • IF() - Проверяет, равен ли первый аргумент 0.0, возвращает второй аргумент, если он не равен нулю, или третий, если равен
  • IN() - Возвращает 1, если первый аргумент равен любому из остальных аргументов, или 0 в противном случае
  • INDEXOF() - Перебирает все элементы массива и возвращает индекс первого совпадающего элемента
  • INTERVAL() - Возвращает индекс аргумента, который меньше первого аргумента
  • LENGTH() - Возвращает количество элементов в MVA
  • REMAP() - Позволяет создавать исключения для значений выражения в зависимости от значений условия
Дата и время
  • NOW() - Возвращает текущую метку времени как INTEGER
  • CURTIME() - Возвращает текущее время в локальном часовом поясе
  • CURDATE() - Возвращает текущую дату в локальном часовом поясе
  • UTC_TIME() - Возвращает текущее время в часовом поясе UTC
  • UTC_TIMESTAMP() - Возвращает текущую дату/время в часовом поясе UTC
  • SECOND() - Возвращает целую секунду из аргумента метки времени
  • MINUTE() - Возвращает целую минуту из аргумента метки времени
  • HOUR() - Возвращает целый час из аргумента метки времени
  • DAY() - Возвращает целый день из аргумента метки времени
  • MONTH() - Возвращает целый месяц из аргумента метки времени
  • QUARTER() - Возвращает целый квартал года из аргумента метки времени
  • YEAR() - Возвращает целый год из аргумента метки времени
  • DAYNAME() - Возвращает название дня недели для заданного аргумента метки времени
  • MONTHNAME() - Возвращает название месяца для заданного аргумента метки времени
  • DAYOFWEEK() - Возвращает целочисленный индекс дня недели для заданного аргумента метки времени
  • DAYOFYEAR() - Возвращает целочисленный день года для заданного аргумента метки времени
  • YEARWEEK() - Возвращает целый год и код дня первого дня текущей недели для заданного аргумента метки времени
  • YEARMONTH() - Возвращает целый год и код месяца из аргумента метки времени
  • YEARMONTHDAY() - Возвращает целый год, месяц и код дня из аргумента метки времени
  • TIMEDIFF() - Возвращает разницу между метками времени
  • DATEDIFF() - Возвращает количество дней между двумя заданными метками времени
  • DATE() - Форматирует часть даты из аргумента метки времени
  • TIME() - Форматирует часть времени из аргумента метки времени
  • DATE_FORMAT() - Возвращает форматированную строку на основе предоставленных аргументов даты и формата
Геопространственные
  • GEODIST() - Вычисляет расстояние по геосфере между двумя заданными точками
  • GEOPOLY2D() - Создает полигон, учитывающий кривизну Земли
  • POLY2D() - Создает простой полигон в плоском пространстве
Строковые
  • CONCAT() - Объединяет две или более строк
  • REGEX() - Возвращает 1, если регулярное выражение совпало со строкой атрибута, и 0 в противном случае
  • SNIPPET() - Подсвечивает результаты поиска
  • SUBSTRING_INDEX() - Возвращает подстроку строки до указанного количества вхождений разделителя
Прочие
  • CONNECTION_ID() - Возвращает идентификатор текущего соединения
  • KNN_DIST() - Возвращает расстояние поиска по векторам KNN
  • LAST_INSERT_ID() - Возвращает идентификаторы документов, вставленных или замененных последним оператором в текущей сессии
  • UUID_SHORT() - Возвращает "короткий" универсальный идентификатор, следующий тому же алгоритму, что и для генерации авто-ID.

Общие настройки в файле конфигурации

Для размещения в секции common {} в файле конфигурации:

  • lemmatizer_base - Базовый путь к словарям лемматизатора
  • progressive_merge - Определяет порядок слияния дисковых чанков в реальном времени
  • json_autoconv_keynames - Следует ли и как автоматически преобразовывать имена ключей в JSON-атрибутах
  • json_autoconv_numbers - Автоматически обнаруживает и преобразует возможные JSON-строки, представляющие числа, в числовые атрибуты
  • on_json_attr_error - Что делать при обнаружении ошибок формата JSON
  • plugin_dir - Расположение динамических библиотек и UDF

indexer - это инструмент для создания обычных таблиц

Настройки индексатора в конфигурационном файле

Размещаются в разделе indexer {} конфигурационного файла:

  • lemmatizer_cache - Размер кэша лемматизатора
  • max_file_field_buffer - Максимальный размер адаптивного буфера поля файла
  • max_iops - Максимальное количество операций ввода-вывода индексации в секунду
  • max_iosize - Максимально допустимый размер операции ввода-вывода
  • max_xmlpipe2_field - Максимально допустимый размер поля для типа источника XMLpipe2
  • mem_limit - Ограничение на использование ОЗУ при индексации
  • on_file_field_error - Способ обработки ошибок ввода-вывода в полях файлов
  • write_buffer - Размер буфера записи
  • ignore_non_plain - Игнорировать предупреждения о нестандартных таблицах
Параметры запуска индексатора
indexer [OPTIONS] [indexname1 [indexname2 [...]]]
  • --all - Перестраивает все таблицы из конфигурации
  • --buildstops - Анализирует источник таблицы так, как при индексации данных, создавая список индексируемых терминов
  • --buildfreqs - Добавляет счётчик частоты в таблицу для --buildstops
  • --config, -c - Указывает путь к конфигурационному файлу
  • --dump-rows - Выгружает строки, извлечённые из SQL источника(-ов), в указанный файл
  • --help - Показывает все доступные параметры
  • --keep-attrs - Позволяет повторно использовать существующие атрибуты при переиндексации
  • --keep-attrs-names - Задаёт, какие атрибуты использовать из существующей таблицы
  • --merge-dst-range - Применяет заданный диапазон фильтрации при слиянии
  • --merge-killlists - Изменяет обработку списка исключений при слиянии таблиц
  • --merge - Объединяет две простые таблицы в одну
  • --nohup - Предотвращает отправку индексатором сигнала SIGHUP при включении данной опции
  • --noprogress - Скрывает подробности прогресса
  • --print-queries - Выводит SQL-запросы, отправляемые индексатором в базу данных
  • --print-rt - Показывает данные, полученные из SQL источника(-ов), в виде INSERT-запросов в таблицу реального времени
  • --quiet - Подавляет весь вывод
  • --rotate - Запускает вращение таблиц после сборки всех таблиц
  • --sighup-each - Запускает вращение каждой таблицы сразу после её сборки
  • -v - Отображает версию индексатора

Конвертер таблиц для Manticore v2 / Sphinx v2

index_converter — это инструмент, предназначенный для конвертации таблиц, созданных с помощью Sphinx/Manticore Search 2.x, в формат таблиц Manticore Search 3.x.

index_converter {--config /path/to/config|--path}
Начальные параметры конвертера таблиц
  • --config, -c - Путь к файлу конфигурации таблицы
  • --index - Указывает, какую таблицу конвертировать
  • --path - Устанавливает путь, содержащий таблицу(ы), вместо файла конфигурации
  • --strip-path - Удаляет путь из имён файлов, на которые ссылается таблица
  • --large-docid - Позволяет конвертировать документы с идентификаторами больше 2^63
  • --output-dir - Записывает новые файлы в указанную папку
  • --all - Конвертирует все таблицы из файла конфигурации / пути
  • --killlist-target - Устанавливает целевые таблицы для применения kill-листов

searchd — это сервер Manticore.

Настройки Searchd в файле конфигурации

Для размещения в секции searchd {} файла конфигурации:

  • access_blob_attrs - Определяет способ доступа к файлу blob-атрибутов таблицы
  • access_doclists - Определяет способ доступа к файлу doclists таблицы
  • access_hitlists - Определяет способ доступа к файлу hitlists таблицы
  • access_plain_attrs - Определяет способ доступа поискового сервера к простым атрибутам таблицы
  • access_dict - Определяет способ доступа к файлу словаря таблицы
  • agent_connect_timeout - Таймаут подключения к удаленному агенту
  • agent_query_timeout - Таймаут запроса к удаленному агенту
  • agent_retry_count - Определяет количество попыток подключения и запроса к удаленным агентам, которые предпринимает Manticore
  • agent_retry_delay - Определяет задержку перед повторной попыткой запроса к удаленному агенту в случае сбоя
  • attr_flush_period - Устанавливает период времени между сбросом обновленных атрибутов на диск
  • binlog_flush - Режим сброса/синхронизации транзакций бинарного лога
  • binlog_max_log_size - Максимальный размер файла бинарного лога
  • binlog_common - Общий файл бинарного лога для всех таблиц
  • binlog_filename_digits - Количество цифр в имени файла бинарного лога
  • binlog_flush - Стратегия сброса бинарного лога
  • binlog_path - Путь к файлам бинарного лога
  • client_timeout - Максимальное время ожидания между запросами при использовании постоянных соединений
  • collation_libc_locale - Локаль libc сервера
  • collation_server - Коллация сервера по умолчанию
  • data_dir - Путь к каталогу данных, где Manticore хранит все данные (RT-режим)
  • diskchunk_flush_write_timeout - Таймаут автоматического сброса RAM-чанка, если в него не было записей
  • diskchunk_flush_search_timeout - Таймаут предотвращения автоматического сброса RAM-чанка, если в таблице не было поисковых запросов
  • docstore_cache_size - Максимальный размер блоков документов из хранилища документов, хранящихся в памяти
  • expansion_limit - Максимальное количество расширенных ключевых слов для одного символа подстановки
  • grouping_in_utc - Включает использование часового пояса UTC для группировки временных полей
  • ha_period_karma - Размер окна статистики зеркал агентов
  • ha_ping_interval - Интервал между пингами зеркал агентов
  • hostname_lookup - Стратегия обновления имен хостов
  • jobs_queue_size - Определяет максимальное количество "задач", разрешенных в очереди одновременно
  • join_batch_size - Определяет размер пакета для объединения таблиц для баланса производительности и использования памяти
  • join_cache_size - Определяет размер кэша для повторного использования результатов запросов JOIN
  • kibana_version_string – Строка версии сервера, отправляемая в ответ на запросы Kibana
  • listen - Определяет IP-адрес и порт или путь к Unix-доменному сокету для прослушивания searchd
  • listen_backlog - Размер очереди прослушивания TCP
  • listen_tfo - Включает флаг TCP_FASTOPEN для всех слушателей
  • log - Путь к файлу журнала сервера Manticore
  • max_batch_queries - Ограничивает количество запросов в пакете
  • max_connections - Максимальное количество активных соединений
  • merge_chunks_per_job - Сколько RT-дисковых чанков объединяется за одну задачу OPTIMIZE
  • max_filters - Максимально допустимое количество фильтров на запрос
  • max_filter_values - Максимально допустимое количество значений на фильтр
  • max_open_files - Максимальное количество файлов, разрешенных для открытия сервером
  • max_packet_size - Максимально допустимый размер сетевого пакета
  • mysql_version_string - Строка версии сервера, возвращаемая по протоколу MySQL
  • net_throttle_accept - Определяет, сколько клиентов принимается на каждой итерации сетевого цикла
  • net_throttle_action - Определяет, сколько запросов обрабатывается на каждой итерации сетевого цикла
  • net_wait_tm - Управляет интервалом активного цикла сетевого потока
  • net_workers - Количество сетевых потоков
  • network_timeout - Сетевой таймаут для запросов клиентов
  • node_address - Определяет сетевой адрес узла
  • persistent_connections_limit - Максимальное количество одновременных постоянных соединений с удаленными постоянными агентами
  • parallel_chunk_merges - Сколько слияний RT-дисковых чанков может выполняться параллельно во время OPTIMIZE
  • pid_file - Путь к pid-файлу сервера Manticore
  • preopen_tables - Определяет, следует ли принудительно предварительно открывать все таблицы при запуске
  • pseudo_sharding - Включает псевдошардинг для поисковых запросов к обычным и реального времени таблицам
  • qcache_max_bytes - Максимальный объем оперативной памяти, выделенный для кэшированных наборов результатов
  • qcache_thresh_msec - Минимальный порог реального времени для кэширования результата запроса
  • qcache_ttl_sec - Срок действия кэшированного набора результатов
  • query_log - Путь к файлу журнала запросов
  • query_log_format - Формат журнала запросов
  • query_log_min_msec - Предотвращает логирование слишком быстрых запросов
  • query_log_mode - Режим прав доступа к файлу журнала запросов
  • read_buffer_docs - Размер буфера чтения на ключевое слово для списков документов
  • read_buffer_hits - Размер буфера чтения на ключевое слово для списков попаданий
  • read_unhinted - Размер чтения без подсказок
  • rt_flush_period - Как часто Manticore сбрасывает RAM-чанки таблиц реального времени на диск
  • rt_merge_iops - Максимальное количество операций ввода-вывода (в секунду), разрешенное для потока слияния чанков реального времени
  • rt_merge_maxiosize - Максимальный размер операции ввода-вывода, разрешенный для потока слияния чанков реального времени
  • seamless_rotate - Предотвращает простои searchd при ротации таблиц с огромными объемами данных для предварительного кэширования
  • secondary_indexes - Включает использование вторичных индексов для поисковых запросов
  • server_id - Идентификатор сервера, используемый как начальное значение для генерации уникального идентификатора документа
  • shutdown_timeout - Таймаут --stopwait для searchd
  • shutdown_token - SHA1-хэш пароля, необходимого для вызова команды shutdown из VIP SQL-соединения
  • skiplist_cache_size - Максимальный размер кэша в памяти для распакованных списков пропуска
  • snippets_file_prefix - Префикс, добавляемый к локальным именам файлов при генерации сниппетов в режиме load_files
  • sphinxql_state - Путь к файлу, в который будет сериализовано текущее состояние SQL
  • sphinxql_timeout - Максимальное время ожидания между запросами от клиента MySQL
  • ssl_ca - Путь к файлу сертификата центра сертификации SSL
  • ssl_cert - Путь к SSL-сертификату сервера
  • ssl_key - Путь к ключу SSL-сертификата сервера
  • subtree_docs_cache - Максимальный размер кэша документов общего поддерева
  • subtree_hits_cache - Максимальный размер кэша попаданий общего поддерева, на запрос
  • timezone - Часовой пояс, используемый функциями, связанными с датой/временем
  • thread_stack - Максимальный размер стека для задачи
  • unlink_old - Удалять ли копии таблиц .old при успешной ротации
  • watchdog - Включить или отключить сторожевой таймер сервера Manticore
Параметры запуска searchd
searchd [OPTIONS]
  • --config, -c - Задает путь к файлу конфигурации
  • --console - Принудительно запускает сервер в консольном режиме
  • --coredump - Включает сохранение дампа памяти при аварийном завершении
  • --cpustats - Включает отчетность о времени процессора
  • --delete - Удаляет службу Manticore из консоли управления Microsoft и других мест, где регистрируются службы
  • --force-preread - Запрещает серверу обслуживать входящие соединения до предварительного чтения файлов таблиц
  • --help, -h - Отображает все доступные параметры
  • --quiet, -q - Выводить только ошибки при запуске
  • --table (--index) - Ограничивает сервер обслуживанием только указанной таблицы
  • --install - Устанавливает searchd как службу в консоли управления Microsoft
  • --iostats - Включает отчетность о вводе/выводе
  • --listen, -l - Переопределяет listen из файла конфигурации
  • --logdebug, --logdebugv, --logdebugvv - Включает дополнительный отладочный вывод в журнал сервера
  • --logreplication - Включает дополнительный отладочный вывод по репликации в журнал сервера
  • --new-cluster - Инициализирует кластер репликации и устанавливает сервер в качестве опорного узла с защитой от перезапуска кластера
  • --new-cluster-force - Инициализирует кластер репликации и устанавливает сервер в качестве опорного узла, обходя защиту от перезапуска кластера
  • --nodetach - Удерживает searchd работающим на переднем плане
  • --ntservice - Используется консолью управления Microsoft для запуска searchd как службы на платформах Windows
  • --pidfile - Переопределяет pid_file в файле конфигурации
  • --port, p - Задает порт, на котором должен слушать searchd, игнорируя порт, указанный в файле конфигурации
  • --replay-flags - Устанавливает дополнительные параметры воспроизведения бинарного лога
  • --servicename - Присваивает searchd заданное имя при установке или удалении службы, как оно отображается в консоли управления Microsoft
  • --status - Запрашивает статус у запущенной службы search
  • --stop - Останавливает сервер Manticore
  • --stopwait - Корректно останавливает сервер Manticore
  • --strip-path - Удаляет имена путей из всех имен файлов, на которые ссылается таблица
  • -v - Отображает информацию о версии
Переменные окружения searchd

Различные функции обслуживания таблиц, полезные для устранения неполадок.

indextool <command> [options]
Параметры запуска Indextool

Используется для вывода различных отладочных данных, связанных с физической таблицей.

indextool <command> [options]
  • --config, -c - Указывает путь к файлу конфигурации
  • --quiet, -q - Отключает вывод информационного баннера indextool и др.
  • --help, -h - Показывает все доступные параметры
  • -v - Отображает информацию о версии
  • Indextool - Проверяет файл конфигурации
  • --buildidf - Создает IDF-файл из одного или нескольких дампов словаря
  • --build-infixes - Создает инфиксы для существующей таблицы dict=keywords
  • --dumpheader - Быстро выводит предоставленный файл заголовка таблицы
  • --dumpconfig - Выводит определение таблицы из указанного файла заголовка таблицы в формате почти совместимом с manticore.conf
  • --dumpheader - Выводит заголовок таблицы по имени таблицы с поиском пути к заголовку в файле конфигурации
  • --dumpdict - Выводит словарь таблицы
  • --dumpdocids - Выводит идентификаторы документов по имени таблицы
  • --dumphitlist - Выводит все вхождения указанного ключевого слова/ID в заданной таблице
  • --docextract - Выполняет проверку таблицы на всем словаре/документах/вхождениях и собирает все слова и вхождения, относящиеся к запрошенному документу
  • --fold - Тестирует токенизацию на основе настроек таблицы
  • --htmlstrip - Фильтрует STDIN используя настройки удаления HTML для указанной таблицы
  • --mergeidf - Объединяет несколько файлов .idf в один файл
  • --morph - Применяет морфологию к предоставленному STDIN и выводит результат в stdout
  • --check - Проверяет файлы данных таблицы на целостность
  • --check-id-dups - Проверяет на дублирование идентификаторов
  • --check-disk-chunk - Проверяет один диск-чанк RT-таблицы
  • --strip-path - Удаляет пути из всех имен файлов, на которые ссылается таблица
  • --rotate - Определяет, проверять ли таблицу в ожидании ротации при использовании --check
  • --apply-killlists - Применяет kill-листы ко всем таблицам, перечисленным в файле конфигурации

Разделяет составные слова на компоненты.

wordbreaker [-dict path/to/dictionary_file] {split|test|bench}
Параметры запуска Wordbreaker
  • STDIN - Принимает строку для разбивки на части
  • -dict - Указывает файл словаря для использования
  • split|test|bench - Указывает команду

Извлекает содержимое файла словаря в формате ispell или MySpell

spelldump [options] <dictionary> <affix> [result] [locale-name]
  • dictionary - Главный файл словаря
  • affix - Файл аффиксов для словаря
  • result - Указывает место вывода данных словаря
  • locale-name - Указывает локаль для использования

Список зарезервированных ключевых слов

Полный алфавитный список ключевых слов, в настоящее время зарезервированных в синтаксисе Manticore SQL (поэтому их нельзя использовать как идентификаторы).

AND, AS, BY, COLUMNARSCAN, DISTINCT, DIV, DOCIDINDEX, EXPLAIN, FACET, FALSE, FORCE, FROM, HYBRID_MATCH, IGNORE, IN, INDEXES, INNER, IS, JOIN, KNN, LEFT, LIMIT, MOD, NOT, NO_COLUMNARSCAN, NO_DOCIDINDEX, NO_SECONDARYINDEX, NULL, OFFSET, ON, OR, ORDER, RELOAD, SECONDARYINDEX, SELECT, SYSFILTERS, TRUE

Документация по старым версиям Manticore

Last modified: March 30, 2026