Ссылки

SQL команды

Управление схемой
  • CREATE TABLE - Создает новую таблицу
  • CREATE TABLE LIKE - Создает таблицу, используя другую в качестве шаблона
  • CREATE TABLE LIKE ... WITH DATA - Копирует таблицу
  • CREATE SOURCE - Создает источник потребителя Kafka
  • CREATE MATERIALIZED VIEW - Преобразование данных из сообщений Kafka
  • CREATE MV - То же, что и предыдущая команда
  • DESCRIBE - Выводит список полей таблицы и их типы
  • ALTER TABLE - Изменяет схему / настройки таблицы
  • ALTER TABLE REBUILD SECONDARY - Обновляет/восстанавливает вторичные индексы
  • ALTER TABLE type='distributed' - Обновляет/восстанавливает вторичные индексы
  • ALTER TABLE RENAME
  • ALTER MATERIALIZED VIEW {name} suspended=1 - Приостанавливает или возобновляет потребление из источника Kafka
  • DROP TABLE IF EXISTS - Удаляет таблицу (если она существует)
  • SHOW TABLES - Показывает список таблиц
  • SHOW SOURCES - Показывает список источников Kafka
  • SHOW MATERIALIZED VIEWS - Показывает список материализованных представлений
  • SHOW MVS - Псевдоним предыдущей команды
  • SHOW CREATE TABLE - Показывает SQL команду для создания таблицы
  • SHOW TABLE INDEXES - Отображает информацию о доступных вторичных индексах таблицы
  • SHOW TABLE STATUS - Показывает информацию о текущем состоянии таблицы
  • SHOW TABLE SETTINGS - Показывает настройки таблицы
  • SHOW LOCKS - Показывает информацию о замороженных таблицах
Управление данными
  • INSERT - Добавляет новые документы
  • REPLACE - Заменяет существующие документы новыми
  • REPLACE .. SET - Заменяет одно или несколько полей в таблице
  • UPDATE - Выполняет обновление документов на месте
  • DELETE - Удаляет документы
  • TRUNCATE TABLE - Удаляет все документы из таблицы
Резервное копирование
  • BACKUP - Создает резервные копии таблиц
SELECT
  • SELECT - Поиск
    • WHERE - Фильтры
    • GROUP BY - Группировка результатов поиска
    • GROUP BY ORDER - Сортировка групп
    • GROUP BY HAVING - Фильтрация групп
    • OPTION - Опции запроса
    • FACET - Фасетный поиск
    • SUB-SELECTS - Использование подзапросов SELECT
    • JOIN - Объединение таблиц в SELECT
  • EXPLAIN QUERY - Показывает план выполнения запроса без его запуска
  • SHOW META - Показывает расширенную информацию о выполненном запросе
  • SHOW PROFILE - Показывает информацию профилирования выполненного запроса
  • SHOW PLAN - Показывает план выполнения запроса после его выполнения
  • SHOW WARNINGS - Показывает предупреждения последнего запроса
Сброс различных данных
  • FLUSH ATTRIBUTES - Принудительно сбрасывает обновленные атрибуты на диск
  • FLUSH HOSTNAMES - Обновляет IP-адреса, связанные с именами хостов агентов
  • FLUSH LOGS - Инициирует повторное открытие файлов логов searchd и запросов (аналогично USR1)
Оптимизация таблиц реального времени
  • FLUSH RAMCHUNK - Принудительно создает новый дисковый чанк
  • FLUSH TABLE - Сбрасывает RAM-чанк таблицы реального времени на диск
  • OPTIMIZE TABLE - Помещает таблицу реального времени в очередь на оптимизацию
Импорт в таблицу реального времени
  • ATTACH TABLE - Перемещает данные из простой таблицы в таблицу реального времени
  • IMPORT TABLE - Импортирует ранее созданную RT или PQ таблицу в сервер, работающий в режиме RT
Репликация
  • JOIN CLUSTER - Присоединяется к кластеру репликации
  • ALTER CLUSTER - Добавляет/удаляет таблицу в кластере репликации
  • SET CLUSTER - Изменяет настройки кластера репликации
  • DELETE CLUSTER - Удаляет кластер репликации
Поворот простой таблицы
  • RELOAD TABLE - Поворачивает простую таблицу
  • RELOAD TABLES - Поворачивает все простые таблицы
Транзакции
  • BEGIN - Начинает транзакцию
  • COMMIT - Завершает транзакцию
  • ROLLBACK - Откатывает транзакцию
CALL
  • CALL SUGGEST, CALL QSUGGEST - Предлагает исправленные слова
  • CALL SNIPPETS - Создает выделенный фрагмент результатов из предоставленных данных и запроса
  • CALL PQ - Выполняет перколяционный запрос
  • CALL KEYWORDS - Используется для проверки того, как токенизируются ключевые слова. Также позволяет получить токенизированные формы предоставленных ключевых слов
  • CALL AUTOCOMPLETE - Автозаполняет ваш поисковый запрос
Плагины
Статус сервера
  • SHOW STATUS - Отображает ряд полезных счетчиков производительности
  • SHOW THREADS - Показывает все текущие активные клиентские потоки
  • SHOW VARIABLES - Показывает переменные сервера и их значения
  • SHOW VERSION - Предоставляет подробную информацию о версиях различных компонентов инстанса.

HTTP endpoints

  • /sql - Выполняет SQL-запрос через HTTP JSON
  • /cli - Предоставляет HTTP интерфейс командной строки
  • /insert - Вставляет документ в таблицу реального времени
  • /pq/tbl_name/doc - Добавляет правило PQ в перколяционную таблицу
  • /update - Обновляет документ в таблице реального времени
  • /replace - Заменяет существующий документ в таблице реального времени или вставляет его, если он не существует
  • /pq/tbl_name/doc/N?refresh=1 - Заменяет правило PQ в перколяционной таблице
  • /delete - Удаляет документ из таблицы
  • /bulk - Выполняет несколько операций вставки, обновления или удаления за один вызов. Подробнее о массовой вставке здесь.
  • /search - Выполняет поиск
  • /search -> knn - Выполняет KNN векторный поиск
  • /pq/tbl_name/search - Выполняет обратный поиск в перколяционной таблице
  • /tbl_name/_mapping - Создает схему таблицы в стиле Elasticsearch

Общие вещи

Общие настройки таблиц
Plain table settings
Distributed table settings
Настройки RT таблицы

Операторы полнотекстового поиска

Функции

Математические
  • ABS() - Возвращает абсолютное значение
  • ATAN2() - Возвращает арктангенс двух аргументов
  • BITDOT() - Возвращает сумму произведений каждого бита маски на его вес
  • CEIL() - Возвращает наименьшее целое число, большее или равное аргументу
  • COS() - Возвращает косинус аргумента
  • CRC32() - Возвращает значение CRC32 аргумента
  • EXP() - Возвращает экспоненту аргумента
  • FIBONACCI() - Возвращает N-е число Фибоначчи, где N — целочисленный аргумент
  • FLOOR() - Возвращает наибольшее целое значение, меньшее или равное аргументу
  • GREATEST() - Принимает JSON/MVA массив в качестве аргумента и возвращает наибольшее значение в этом массиве
  • IDIV() - Возвращает результат целочисленного деления первого аргумента на второй аргумент
  • LEAST() - Принимает JSON/MVA массив в качестве аргумента и возвращает наименьшее значение в этом массиве
  • LN() - Возвращает натуральный логарифм аргумента
  • LOG10() - Возвращает десятичный логарифм аргумента
  • LOG2() - Возвращает двоичный логарифм аргумента
  • MAX() - Возвращает большее из двух аргументов
  • MIN() - Возвращает меньшее из двух аргументов
  • POW() - Возвращает первый аргумент, возведённый в степень второго аргумента
  • RAND() - Возвращает случайное число с плавающей точкой от 0 до 1
  • SIN() - Возвращает синус аргумента
  • SQRT() - Возвращает квадратный корень из аргумента
Поиск и ранжирование
  • BM25F() - Возвращает точное значение формулы BM25F
  • EXIST() - Заменяет несуществующие столбцы значениями по умолчанию
  • GROUP_CONCAT() - Формирует список значений атрибута всех документов в группе, разделённых запятыми
  • HIGHLIGHT() - Подсвечивает результаты поиска
  • MIN_TOP_SORTVAL() - Возвращает значение ключа сортировки худшего найденного элемента в текущих топ-N совпадениях
  • MIN_TOP_WEIGHT() - Возвращает вес худшего найденного элемента в текущих топ-N совпадениях
  • PACKEDFACTORS() - Выводит весовые коэффициенты
  • REMOVE_REPEATS() - Удаляет повторяющиеся скорректированные строки с одинаковым значением 'column'
  • WEIGHT() - Возвращает оценку совпадения полнотекстового поиска
  • ZONESPANLIST() - Возвращает пары совпадающих зональных интервалов
  • QUERY() - Возвращает текущий полнотекстовый запрос
Приведение типов
  • BIGINT() - Принудительно преобразует целочисленный аргумент в 64-битный тип
  • DOUBLE() - Принудительно преобразует данный аргумент в тип с плавающей точкой
  • INTEGER() - Принудительно преобразует данный аргумент в 64-битный знаковый тип
  • TO_STRING() - Принудительно преобразует аргумент в строковый тип
  • UINT() - Преобразует данный аргумент в 32-битное беззнаковое целое число
  • UINT64() - Преобразует данный аргумент в 64-битное беззнаковое целое число
  • SINT() - Интерпретирует 32-битное беззнаковое целое число как знаковое 64-битное целое число
Массивы и условия
  • ALL() - Возвращает 1, если условие истинно для всех элементов массива
  • ANY() - Возвращает 1, если условие истинно для любого элемента массива
  • CONTAINS() - Проверяет, находится ли точка (x,y) внутри заданного полигона
  • IF() - Проверяет, равен ли первый аргумент 0.0, возвращает второй аргумент, если он не равен нулю, или третий, если равен
  • IN() - Возвращает 1, если первый аргумент равен любому из остальных аргументов, иначе 0
  • INDEXOF() - Перебирает все элементы массива и возвращает индекс первого совпадающего элемента
  • INTERVAL() - Возвращает индекс аргумента, который меньше первого аргумента
  • LENGTH() - Возвращает количество элементов в MVA
  • REMAP() - Позволяет делать исключения из значений выражения в зависимости от значений условий
Дата и время
  • NOW() - Возвращает текущую метку времени в виде INTEGER
  • CURTIME() - Возвращает текущее время в локальном часовом поясе
  • CURDATE() - Возвращает текущую дату в локальном часовом поясе
  • UTC_TIME() - Возвращает текущее время в часовом поясе UTC
  • UTC_TIMESTAMP() - Возвращает текущие дату и время в часовом поясе UTC
  • SECOND() - Возвращает целочисленное значение секунд из аргумента метки времени
  • MINUTE() - Возвращает целочисленное значение минут из аргумента метки времени
  • HOUR() - Возвращает целочисленный час из аргумента временной метки
  • DAY() - Возвращает целочисленный день из аргумента временной метки
  • MONTH() - Возвращает целочисленный месяц из аргумента временной метки
  • QUARTER() - Возвращает целочисленный квартал года из аргумента временной метки
  • YEAR() - Возвращает целочисленный год из аргумента временной метки
  • DAYNAME() - Возвращает название дня недели для заданного аргумента временной метки
  • MONTHNAME() - Возвращает название месяца для заданного аргумента временной метки
  • DAYOFWEEK() - Возвращает целочисленный индекс дня недели для заданного аргумента временной метки
  • DAYOFYEAR() - Возвращает целочисленный день года для заданного аргумента временной метки
  • YEARWEEK() - Возвращает целочисленный год и код дня первого дня текущей недели для заданного аргумента временной метки
  • YEARMONTH() - Возвращает целочисленный код года и месяца из аргумента временной метки
  • YEARMONTHDAY() - Возвращает целочисленные коды года, месяца и дня из аргумента временной метки
  • TIMEDIFF() - Возвращает разницу между временными метками
  • DATEDIFF() - Возвращает количество дней между двумя заданными временными метками
  • DATE() - Форматирует часть даты из аргумента временной метки
  • TIME() - Форматирует часть времени из аргумента временной метки
  • DATE_FORMAT() - Возвращает форматированную строку на основе предоставленных аргументов даты и формата
Геопространственные
  • GEODIST() - Вычисляет геосферное расстояние между двумя заданными точками
  • GEOPOLY2D() - Создает полигон с учетом кривизны Земли
  • POLY2D() - Создает простой полигон в плоском пространстве
Строковые
  • CONCAT() - Конкатенирует две или более строк
  • REGEX() - Возвращает 1, если регулярное выражение совпало со строкой атрибута, и 0 в противном случае
  • SNIPPET() - Подсвечивает результаты поиска
  • SUBSTRING_INDEX() - Возвращает подстроку строки до указанного количества вхождений разделителя
Прочее
  • CONNECTION_ID() - Возвращает текущий идентификатор соединения
  • KNN_DIST() - Возвращает расстояние поиска KNN в векторном пространстве
  • LAST_INSERT_ID() - Возвращает идентификаторы документов, вставленных или замененных последним оператором в текущей сессии
  • UUID_SHORT() - Возвращает "короткий" универсальный идентификатор, следующий тому же алгоритму, что и для генерации авто-id.

Общие настройки в конфигурационном файле

Должны быть помещены в секцию common {} в конфигурационном файле:

  • lemmatizer_base - Базовый путь к словарям лемматизатора
  • progressive_merge - Определяет порядок слияния дисковых чанков в таблице реального времени
  • json_autoconv_keynames - Включение и способ автоконвертации имен ключей в JSON-атрибутах
  • json_autoconv_numbers - Автоматически обнаруживает и конвертирует возможные JSON-строки, представляющие числа, в числовые атрибуты
  • on_json_attr_error - Действия при обнаружении ошибок формата JSON
  • plugin_dir - Расположение динамических библиотек и UDF

indexer — это инструмент для создания plain tables

Настройки Indexer в конфигурационном файле

Должны быть помещены в секцию indexer {} в конфигурационном файле:

  • lemmatizer_cache - Размер кэша лемматизатора
  • max_file_field_buffer - Максимальный адаптивный буфер для файлового поля
  • max_iops - Максимальное количество операций ввода-вывода индексации в секунду
  • max_iosize - Максимально допустимый размер операции ввода-вывода
  • max_xmlpipe2_field - Максимально допустимый размер поля для источника типа XMLpipe2
  • mem_limit - Лимит использования оперативной памяти при индексации
  • on_file_field_error - Как обрабатывать ошибки ввода-вывода в файловых полях
  • write_buffer - Размер буфера записи
  • ignore_non_plain - Игнорировать предупреждения о не-простых таблицах
Параметры запуска индексатора
indexer [OPTIONS] [indexname1 [indexname2 [...]]]
  • --all - Перестраивает все таблицы из конфигурации
  • --buildstops - Анализирует источник таблицы как при индексировании данных, создавая список индексируемых терминов
  • --buildfreqs - Добавляет подсчет частоты в таблицу для --buildstops
  • --config, -c - Указывает путь к файлу конфигурации
  • --dump-rows - Выгружает строки, полученные из SQL источника(ов), в указанный файл
  • --help - Показывает все доступные параметры
  • --keep-attrs - Позволяет повторно использовать существующие атрибуты при переиндексации
  • --keep-attrs-names - Указывает, какие атрибуты использовать повторно из существующей таблицы
  • --merge-dst-range - Применяет заданный диапазон фильтра при слиянии
  • --merge-killlists - Изменяет обработку списков удаления при слиянии таблиц
  • --merge - Объединяет две простые таблицы в одну
  • --nohup - Предотвращает отправку SIGHUP индексатором при включении этой опции
  • --noprogress - Скрывает детали прогресса
  • --print-queries - Выводит SQL-запросы, отправляемые индексатором в базу данных
  • --print-rt - Показывает данные, полученные из SQL источника(ов), в виде INSERT-запросов в таблицу реального времени
  • --quiet - Подавляет весь вывод
  • --rotate - Запускает ротацию таблиц после построения всех таблиц
  • --sighup-each - Запускает ротацию каждой таблицы после её построения
  • -v - Показывает версию индексатора

Конвертер таблиц для Manticore v2 / Sphinx v2

index_converter — это инструмент, предназначенный для конвертации таблиц, созданных с помощью Sphinx/Manticore Search 2.x, в формат таблиц Manticore Search 3.x.

index_converter {--config /path/to/config|--path}
Параметры запуска конвертера таблиц
  • --config, -c - Путь к файлу конфигурации таблицы
  • --index - Указывает, какую таблицу конвертировать
  • --path - Устанавливает путь, содержащий таблицу(ы), вместо файла конфигурации
  • --strip-path - Удаляет путь из имен файлов, на которые ссылается таблица
  • --large-docid - Позволяет конвертировать документы с id больше 2^63
  • --output-dir - Записывает новые файлы в указанную папку
  • --all - Конвертирует все таблицы из файла конфигурации / пути
  • --killlist-target - Устанавливает целевые таблицы для применения списков удаления

searchd — это сервер Manticore.

Настройки searchd в файле конфигурации

Должны быть помещены в секцию searchd {} файла конфигурации:

  • access_blob_attrs - Определяет, как осуществляется доступ к файлу blob-атрибутов таблицы
  • access_doclists - Определяет, как осуществляется доступ к файлу doclists таблицы
  • access_hitlists - Определяет, как осуществляется доступ к файлу hitlists таблицы
  • access_plain_attrs - Определяет, как поисковый сервер получает доступ к простым атрибутам таблицы
  • access_dict - Определяет, как осуществляется доступ к файлу словаря таблицы
  • agent_connect_timeout - Таймаут подключения к удалённому агенту
  • agent_query_timeout - Таймаут запроса к удалённому агенту
  • agent_retry_count - Определяет количество попыток подключения и запроса к удалённым агентам в Manticore
  • agent_retry_delay - Определяет задержку перед повторной попыткой запроса к удалённому агенту в случае неудачи
  • attr_flush_period - Устанавливает период времени между сбросом обновлённых атрибутов на диск
  • binlog_flush - Режим сброса/синхронизации бинарного лога транзакций
  • binlog_max_log_size - Максимальный размер файла бинарного лога
  • binlog_common - Общий файл бинарного лога для всех таблиц
  • binlog_filename_digits - Количество цифр в имени файла бинарного лога
  • binlog_flush - Стратегия сброса бинарного лога
  • binlog_path - Путь к файлам бинарного лога
  • client_timeout - Максимальное время ожидания между запросами при использовании постоянных соединений
  • collation_libc_locale - Локаль libc сервера
  • collation_server - Колляция сервера по умолчанию
  • data_dir - Путь к каталогу данных, где Manticore хранит всё (RT режим)
  • diskchunk_flush_write_timeout - Таймаут для автоматического сброса RAM-чанка, если в него не происходит запись
  • diskchunk_flush_search_timeout - Таймаут для предотвращения автоматического сброса RAM-чанка, если в таблице не выполняются поиски
  • docstore_cache_size - Максимальный размер блоков документов из хранилища документов, удерживаемых в памяти
  • expansion_limit - Максимальное количество расширенных ключевых слов для одного шаблона с подстановочными знаками
  • grouping_in_utc - Включает использование часового пояса UTC для группировки временных полей
  • ha_period_karma - Размер окна статистики зеркала агента
  • ha_ping_interval - Интервал между пингами зеркала агента
  • hostname_lookup - Стратегия обновления имён хостов
  • jobs_queue_size - Определяет максимальное количество "заданий", разрешённых в очереди одновременно
  • join_batch_size - Определяет размер пакета для объединения таблиц для балансировки производительности и использования памяти
  • join_cache_size - Определяет размер кэша для повторного использования результатов JOIN-запросов
  • kibana_version_string – Строка версии сервера, отправляемая в ответ на запросы Kibana
  • listen - Указывает IP-адрес и порт или путь к Unix-доменному сокету, на которых searchd слушает
  • listen_backlog - Очередь прослушивания TCP
  • listen_tfo - Включает флаг TCP_FASTOPEN для всех слушателей
  • log - Путь к файлу журнала сервера Manticore
  • max_batch_queries - Ограничивает количество запросов в пакете
  • max_connections - Максимальное количество активных соединений
  • max_filters - Максимально допустимое количество фильтров на запрос
  • max_filter_values - Максимально допустимое количество значений в фильтре
  • max_open_files - Максимальное количество файлов, которые сервер может открыть
  • max_packet_size - Максимально допустимый размер сетевого пакета
  • mysql_version_string - Строка версии сервера, возвращаемая через протокол MySQL
  • net_throttle_accept - Определяет, сколько клиентов принимается на каждой итерации сетевого цикла
  • net_throttle_action - Определяет, сколько запросов обрабатывается на каждой итерации сетевого цикла
  • net_wait_tm - Управляет интервалом busy loop сетевого потока
  • net_workers - Количество сетевых потоков
  • network_timeout - Таймаут сети для клиентских запросов
  • node_address - Указывает сетевой адрес узла
  • persistent_connections_limit - Максимальное количество одновременных постоянных соединений с удалёнными постоянными агентами
  • pid_file - Путь к файлу pid сервера Manticore
  • predicted_time_costs - Затраты для модели предсказания времени запроса
  • preopen_tables - Определяет, следует ли принудительно предварительно открывать все таблицы при запуске
  • pseudo_sharding - Включает псевдо-шардинг для поисковых запросов к обычным и реальным таблицам
  • qcache_max_bytes - Максимальный объем оперативной памяти, выделяемый для кэшированных наборов результатов
  • qcache_thresh_msec - Минимальный порог времени выполнения запроса для кэширования результата
  • qcache_ttl_sec - Период хранения кэшированного набора результатов
  • query_log - Путь к файлу журнала запросов
  • query_log_format - Формат журнала запросов
  • query_log_min_msec - Предотвращает логирование слишком быстрых запросов
  • query_log_mode - Режим прав доступа к файлу журнала запросов
  • read_buffer_docs - Размер буфера чтения на ключевое слово для списков документов
  • read_buffer_hits - Размер буфера чтения на ключевое слово для списков попаданий
  • read_unhinted - Размер чтения без подсказок
  • rt_flush_period - Как часто Manticore сбрасывает в диск RAM-чонки реальных таблиц
  • rt_merge_iops - Максимальное количество операций ввода-вывода (в секунду), разрешенных для потока слияния чанков реального времени
  • rt_merge_maxiosize - Максимальный размер операции ввода-вывода, разрешенный для потока слияния чанков реального времени
  • seamless_rotate - Предотвращает зависания searchd при ротации таблиц с огромным объемом данных для предварительного кэширования
  • secondary_indexes - Включает использование вторичных индексов для поисковых запросов
  • server_id - Идентификатор сервера, используемый как зерно для генерации уникального ID документа
  • shutdown_timeout - Таймаут --stopwait для searchd
  • shutdown_token - SHA1-хэш пароля, необходимого для вызова команды shutdown из VIP SQL соединения
  • snippets_file_prefix - Префикс, добавляемый к локальным именам файлов при генерации сниппетов в режиме load_files
  • sphinxql_state - Путь к файлу, в котором будет сериализовано текущее состояние SQL
  • sphinxql_timeout - Максимальное время ожидания между запросами от клиента MySQL
  • ssl_ca - Путь к файлу сертификата удостоверяющего центра SSL
  • ssl_cert - Путь к SSL-сертификату сервера
  • ssl_key - Путь к ключу SSL-сертификата сервера
  • subtree_docs_cache - Максимальный размер кэша документов общего поддерева
  • subtree_hits_cache - Максимальный размер кэша попаданий общего поддерева на запрос
  • timezone - Часовой пояс, используемый функциями, связанными с датой и временем
  • thread_stack - Максимальный размер стека для задачи
  • unlink_old - Следует ли удалять копии таблиц с расширением .old при успешной ротации
  • watchdog - Включить или отключить сторожевой таймер сервера Manticore
Параметры запуска Searchd
searchd [OPTIONS]
  • --config, -c - Указывает путь к файлу конфигурации
  • --console - Принудительно запускает сервер в консольном режиме
  • --coredump - Включает сохранение core dump при сбое
  • --cpustats - Включает отчет о времени работы CPU
  • --delete - Удаляет службу Manticore из Microsoft Management Console и других мест регистрации служб
  • --force-preread - Запрещает серверу обслуживать входящие соединения до предварительного чтения файлов таблиц
  • --help, -h - Показывает все доступные параметры
  • --table (--index) - Ограничивает сервер обслуживанием только указанной таблицы
  • --install - Устанавливает searchd как службу в Microsoft Management Console
  • --iostats - Включает отчет о вводе/выводе
  • --listen, -l - Переопределяет listen из файла конфигурации
  • --logdebug, --logdebugv, --logdebugvv - Включает дополнительный отладочный вывод в журнал сервера
  • --logreplication - Включает дополнительный отладочный вывод репликации в журнал сервера
  • --new-cluster - Инициализирует кластер репликации и устанавливает сервер в качестве эталонного узла с защитой перезапуска кластера
  • --new-cluster-force - Инициализирует кластер репликации и устанавливает сервер в качестве эталонного узла, обходя защиту перезапуска кластера
  • --nodetach - Запускает searchd в переднем плане
  • --ntservice - Используется Microsoft Management Console для запуска searchd как службы на платформах Windows
  • --pidfile - Переопределяет pid_file в конфигурационном файле
  • --port, p - Указывает порт, на котором searchd должен слушать, игнорируя порт, указанный в конфигурационном файле
  • --replay-flags - Устанавливает дополнительные параметры воспроизведения бинарного лога
  • --servicename - Присваивает указанное имя searchd при установке или удалении службы, как отображается в Microsoft Management Console
  • --status - Запрашивает статус работающей службы поиска
  • --stop - Останавливает сервер Manticore
  • --stopwait - Корректно останавливает сервер Manticore
  • --strip-path - Удаляет пути из всех имен файлов, на которые ссылается таблица
  • -v - Отображает информацию о версии
Переменные окружения Searchd

Разнообразные функции обслуживания таблиц, полезные для устранения неполадок.

indextool <command> [options]
Параметры запуска Indextool

Используется для вывода различной отладочной информации, связанной с физической таблицей.

indextool <command> [options]
  • --config, -c - Указывает путь к конфигурационному файлу
  • --quiet, -q - Запускает indextool в тихом режиме; без вывода баннера и т.п.
  • --help, -h - Выводит список всех доступных параметров
  • -v - Отображает информацию о версии
  • Indextool - Проверяет конфигурационный файл
  • --buildidf - Создаёт IDF-файл из одного или нескольких дампов словаря
  • --build-infixes - Создаёт инфиксы для существующей таблицы dict=keywords
  • --dumpheader - Быстро выводит заголовочный файл указанной таблицы
  • --dumpconfig - Выводит определение таблицы из указанного заголовочного файла в формате, близком к manticore.conf
  • --dumpheader - Выводит заголовок таблицы по имени, осуществляя поиск пути заголовка в конфигурационном файле
  • --dumpdict - Выводит словарь таблицы
  • --dumpdocids - Выводит идентификаторы документов по имени таблицы
  • --dumphitlist - Выводит все вхождения указанного ключевого слова/ID в заданной таблице
  • --docextract - Выполняет проверку таблицы на всем словаре/документах/вхождениях и собирает все слова и вхождения, относящиеся к запрошенному документу
  • --fold - Тестирует токенизацию на основе настроек таблицы
  • --htmlstrip - Фильтрует STDIN с использованием настроек HTML-стриппера для указанной таблицы
  • --mergeidf - Объединяет несколько .idf файлов в один
  • --morph - Применяет морфологию к переданному STDIN и выводит результат в stdout
  • --check - Проверяет файлы данных таблицы на согласованность
  • --check-id-dups - Проверяет наличие дублирующихся ID
  • --check-disk-chunk - Проверяет один диск-чанк RT таблицы
  • --strip-path - Удаляет пути из всех имен файлов, на которые ссылается таблица
  • --rotate - Определяет, следует ли проверять таблицу в ожидании ротации при использовании --check
  • --apply-killlists - Применяет kill-листы ко всем таблицам, перечисленным в конфигурационном файле

Разбивает составные слова на компоненты.

wordbreaker [-dict path/to/dictionary_file] {split|test|bench}
Параметры запуска Wordbreaker
  • STDIN - Принимает строку для разбиения на части
  • -dict - Указывает файл словаря для использования
  • split|test|bench - Указывает команду

Извлекает содержимое файла словаря в формате ispell или MySpell

spelldump [options] <dictionary> <affix> [result] [locale-name]
  • dictionary - Основной файл словаря
  • affix - Файл аффиксов для словаря
  • result - Указывает место вывода данных словаря
  • locale-name - Указывает детали локали для использования

Список зарезервированных ключевых слов

Полный алфавитный список ключевых слов, в настоящее время зарезервированных в синтаксисе Manticore SQL (поэтому они не могут использоваться в качестве идентификаторов).

AND, AS, BY, COLUMNARSCAN, DISTINCT, DIV, DOCIDINDEX, EXPLAIN, FACET, FALSE, FORCE, FROM, IGNORE, IN, INDEXES, INNER, IS, JOIN, KNN, LEFT, LIMIT, MOD, NOT, NO_COLUMNARSCAN, NO_DOCIDINDEX, NO_SECONDARYINDEX, NULL, OFFSET, ON, OR, ORDER, RELOAD, SECONDARYINDEX, SELECT, SYSFILTERS, TRUE

Документация для старых версий Manticore

Last modified: December 05, 2025