References

SQL команды

Управление схемой
Управление данными
  • INSERT - Добавляет новые документы
  • REPLACE - Заменяет существующие документы новыми
  • REPLACE .. SET - Заменяет одно или несколько полей в таблице
  • UPDATE - Выполняет обновление на месте в документах
  • DELETE - Удаляет документы
  • TRUNCATE TABLE - Удаляет все документы из таблицы
Резервное копирование
  • BACKUP - Создает резервные копии ваших таблиц
SELECT
  • SELECT - Поиск
    • WHERE - Фильтры
    • GROUP BY - Группирует результаты поиска
    • GROUP BY ORDER - Сортирует группы
    • GROUP BY HAVING - Фильтрует группы
    • OPTION - Опции запроса
    • FACET - Фасетный поиск
    • SUB-SELECTS - Об использовании подзапросов SELECT
    • JOIN - Объединение таблиц в SELECT
  • EXPLAIN QUERY - Показывает план выполнения запроса без его запуска
  • SHOW META - Показывает расширенную информацию о выполненном запросе
  • SHOW PROFILE - Показывает профилирование выполненного запроса
  • SHOW PLAN - Показывает план выполнения запроса после его выполнения
  • SHOW WARNINGS - Показывает предупреждения последнего запроса
Сброс различных вещей
  • FLUSH ATTRIBUTES - Принудительно сбрасывает обновленные атрибуты на диск
  • FLUSH HOSTNAMES - Обновляет IP-адреса, связанные с именами хостов агентов
  • FLUSH LOGS - Инициирует переоткрытие файлов логов searchd и запросов (аналогично USR1)
Оптимизация таблиц реального времени
  • FLUSH RAMCHUNK - Принудительно создает новый диск
  • FLUSH TABLE - Сбрасывает RAM-чанк таблицы реального времени на диск
  • OPTIMIZE TABLE - Помещает таблицу реального времени в очередь на оптимизацию
Импорт в таблицу реального времени
  • ATTACH TABLE - Переносит данные из обычной таблицы в таблицу реального времени
  • IMPORT TABLE - Импортирует ранее созданную таблицу RT или PQ в сервер, работающий в режиме RT
Репликация
  • JOIN CLUSTER - Присоединяется к кластеру репликации
  • ALTER CLUSTER - Добавляет/удаляет таблицу в кластере репликации
  • SET CLUSTER - Изменяет настройки кластера репликации
  • DELETE CLUSTER - Удаляет кластер репликации
Вращение простой таблицы
  • RELOAD TABLE - Вращает простую таблицу
  • RELOAD TABLES - Вращает все простые таблицы
Транзакции
  • BEGIN - Начинает транзакцию
  • COMMIT - Завершает транзакцию
  • ROLLBACK - Откатывает транзакцию
CALL
  • CALL SUGGEST, CALL QSUGGEST - Предлагает слова с исправлением орфографии
  • CALL SNIPPETS - Создаёт фрагмент с подсветкой результатов из предоставленных данных и запроса
  • CALL PQ - Выполняет перколяционный запрос
  • CALL KEYWORDS - Используется для проверки токенизации ключевых слов. Также позволяет получить токенизированные формы предоставленных ключевых слов
  • CALL AUTOCOMPLETE - Автозаполняет ваш поисковый запрос
Плагины
Статус сервера
  • SHOW STATUS - Отображает ряд полезных счетчиков производительности
  • SHOW THREADS - Перечисляет все текущие активные потоки клиентов
  • SHOW VARIABLES - Перечисляет переменные сервера и их значения
  • SHOW VERSION - Предоставляет подробную информацию о версиях различных компонентов инстанса.

HTTP эндпоинты

  • /sql - Выполняет SQL-запрос через HTTP JSON
  • /cli - Обеспечивает HTTP интерфейс командной строки
  • /insert - Вставляет документ в таблицу реального времени
  • /pq/tbl_name/doc - Добавляет правило PQ в перколяционную таблицу
  • /update - Обновляет документ в таблице реального времени
  • /replace - Заменяет существующий документ в таблице реального времени или вставляет его, если он не существует
  • /pq/tbl_name/doc/N?refresh=1 - Заменяет правило PQ в перколяционной таблице
  • /delete - Удаляет документ из таблицы
  • /bulk - Выполняет несколько операций вставки, обновления или удаления за один вызов. Подробнее о массовых вставках здесь.
  • /search - Выполняет поиск
  • /search -> knn - Выполняет KNN векторный поиск
  • /pq/tbl_name/search - Выполняет обратный поиск в перколяционной таблице
  • /tbl_name/_mapping - Создаёт схему таблицы в стиле Elasticsearch

Общие сведения

Общие настройки таблиц
Настройки обычных таблиц
Настройки распределенных таблиц
Настройки RT-таблиц

Операторы полнотекстового поиска

Функции

Математические
  • ABS() - Возвращает абсолютное значение
  • ATAN2() - Возвращает арктангенс от двух аргументов
  • BITDOT() - Возвращает сумму произведений каждого бита маски на его вес
  • CEIL() - Возвращает наименьшее целое значение, большее или равное аргументу
  • COS() - Возвращает косинус аргумента
  • CRC32() - Возвращает значение CRC32 аргумента
  • EXP() - Возвращает экспоненту аргумента
  • FIBONACCI() - Возвращает N-е число Фибоначчи, где N - целочисленный аргумент
  • FLOOR() - Возвращает наибольшее целое значение, меньшее или равное аргументу
  • GREATEST() - Принимает JSON/MVA массив в качестве аргумента и возвращает наибольшее значение в этом массиве
  • IDIV() - Возвращает результат целочисленного деления первого аргумента на второй аргумент
  • LEAST() - Принимает JSON/MVA массив в качестве аргумента и возвращает наименьшее значение в этом массиве
  • LN() - Возвращает натуральный логарифм аргумента
  • LOG10() - Возвращает десятичный логарифм аргумента
  • LOG2() - Возвращает двоичный логарифм аргумента
  • MAX() - Возвращает больший из двух аргументов
  • MIN() - Возвращает меньший из двух аргументов
  • POW() - Возвращает первый аргумент, возведенный в степень второго аргумента
  • RAND() - Возвращает случайное число с плавающей точкой от 0 до 1
  • SIN() - Возвращает синус аргумента
  • SQRT() - Возвращает квадратный корень аргумента
Поиск и ранжирование
  • BM25F() - Возвращает точное значение формулы BM25F
  • EXIST() - Заменяет несуществующие столбцы значениями по умолчанию
  • GROUP_CONCAT() - Создает список значений атрибутов всех документов в группе, разделенный запятыми
  • HIGHLIGHT() - Подсвечивает результаты поиска
  • MIN_TOP_SORTVAL() - Возвращает значение ключа сортировки худшего найденного элемента в текущих top-N совпадениях
  • MIN_TOP_WEIGHT() - Возвращает вес худшего найденного элемента в текущих top-N совпадениях
  • PACKEDFACTORS() - Выводит весовые коэффициенты
  • REMOVE_REPEATS() - Удаляет повторяющиеся скорректированные строки с одинаковым значением 'column'
  • WEIGHT() - Возвращает оценку полнотекстового совпадения
  • ZONESPANLIST() - Возвращает пары совпавших зонных интервалов
  • QUERY() - Возвращает текущий полнотекстовый запрос
Преобразование типов
  • BIGINT() - Принудительно преобразует целочисленный аргумент к 64-битному типу
  • DOUBLE() - Принудительно преобразует заданный аргумент к типу с плавающей точкой
  • INTEGER() - Принудительно преобразует заданный аргумент к 64-битному знаковому типу
  • TO_STRING() - Принудительно преобразует аргумент к строковому типу
  • UINT() - Преобразует заданный аргумент к 32-битному беззнаковому целочисленному типу
  • UINT64() - Преобразует заданный аргумент к 64-битному беззнаковому целочисленному типу
  • SINT() - Интерпретирует 32-битное беззнаковое целое как 64-битное знаковое целое
Массивы и условия
  • ALL() - Возвращает 1, если условие истинно для всех элементов массива
  • ANY() - Возвращает 1, если условие истинно для любого элемента массива
  • CONTAINS() - Проверяет, находится ли точка (x,y) внутри заданного полигона
  • IF() - Проверяет, равен ли первый аргумент 0.0, возвращает второй аргумент, если он не равен нулю, или третий, если равен
  • IN() - Возвращает 1, если первый аргумент равен любому из остальных аргументов, или 0 в противном случае
  • INDEXOF() - Перебирает все элементы массива и возвращает индекс первого совпадающего элемента
  • INTERVAL() - Возвращает индекс аргумента, который меньше первого аргумента
  • LENGTH() - Возвращает количество элементов в MVA
  • REMAP() - Позволяет создавать исключения для значений выражения в зависимости от значений условия
Дата и время
  • NOW() - Возвращает текущую метку времени как INTEGER
  • CURTIME() - Возвращает текущее время в локальном часовом поясе
  • CURDATE() - Возвращает текущую дату в локальном часовом поясе
  • UTC_TIME() - Возвращает текущее время в часовом поясе UTC
  • UTC_TIMESTAMP() - Возвращает текущую дату/время в часовом поясе UTC
  • SECOND() - Возвращает целую секунду из аргумента метки времени
  • MINUTE() - Возвращает целую минуту из аргумента метки времени
  • HOUR() - Возвращает целый час из аргумента метки времени
  • DAY() - Возвращает целый день из аргумента метки времени
  • MONTH() - Возвращает целый месяц из аргумента метки времени
  • QUARTER() - Возвращает целый квартал года из аргумента метки времени
  • YEAR() - Возвращает целый год из аргумента метки времени
  • DAYNAME() - Возвращает название дня недели для заданного аргумента метки времени
  • MONTHNAME() - Возвращает название месяца для заданного аргумента метки времени
  • DAYOFWEEK() - Возвращает целочисленный индекс дня недели для заданного аргумента метки времени
  • DAYOFYEAR() - Возвращает целочисленный день года для заданного аргумента метки времени
  • YEARWEEK() - Возвращает целый год и код дня первого дня текущей недели для заданного аргумента метки времени
  • YEARMONTH() - Возвращает целый год и код месяца из аргумента метки времени
  • YEARMONTHDAY() - Возвращает целый год, месяц и код дня из аргумента метки времени
  • TIMEDIFF() - Возвращает разницу между метками времени
  • DATEDIFF() - Возвращает количество дней между двумя заданными метками времени
  • DATE() - Форматирует часть даты из аргумента метки времени
  • TIME() - Форматирует часть времени из аргумента метки времени
  • DATE_FORMAT() - Возвращает форматированную строку на основе предоставленных аргументов даты и формата
Геопространственные
  • GEODIST() - Вычисляет расстояние по геосфере между двумя заданными точками
  • GEOPOLY2D() - Создает полигон, учитывающий кривизну Земли
  • POLY2D() - Создает простой полигон в плоском пространстве
Строковые
  • CONCAT() - Объединяет две или более строк
  • REGEX() - Возвращает 1, если регулярное выражение совпало со строкой атрибута, и 0 в противном случае
  • SNIPPET() - Подсвечивает результаты поиска
  • SUBSTRING_INDEX() - Возвращает подстроку строки до указанного количества вхождений разделителя
Прочие
  • CONNECTION_ID() - Возвращает идентификатор текущего соединения
  • KNN_DIST() - Возвращает расстояние поиска по векторам KNN
  • LAST_INSERT_ID() - Возвращает идентификаторы документов, вставленных или замененных последним оператором в текущей сессии
  • UUID_SHORT() - Возвращает "короткий" универсальный идентификатор, следующий тому же алгоритму, что и для генерации авто-ID.

Общие настройки в файле конфигурации

Для размещения в секции common {} в файле конфигурации:

  • lemmatizer_base - Базовый путь к словарям лемматизатора
  • progressive_merge - Определяет порядок слияния дисковых чанков в реальном времени
  • json_autoconv_keynames - Следует ли и как автоматически преобразовывать имена ключей в JSON-атрибутах
  • json_autoconv_numbers - Автоматически обнаруживает и преобразует возможные JSON-строки, представляющие числа, в числовые атрибуты
  • on_json_attr_error - Что делать при обнаружении ошибок формата JSON
  • plugin_dir - Расположение динамических библиотек и UDF

indexer - это инструмент для создания обычных таблиц

Настройки индексатора в конфигурационном файле

Размещаются в разделе indexer {} конфигурационного файла:

  • lemmatizer_cache - Размер кэша лемматизатора
  • max_file_field_buffer - Максимальный размер адаптивного буфера поля файла
  • max_iops - Максимальное количество операций ввода-вывода индексации в секунду
  • max_iosize - Максимально допустимый размер операции ввода-вывода
  • max_xmlpipe2_field - Максимально допустимый размер поля для типа источника XMLpipe2
  • mem_limit - Ограничение на использование ОЗУ при индексации
  • on_file_field_error - Способ обработки ошибок ввода-вывода в полях файлов
  • write_buffer - Размер буфера записи
  • ignore_non_plain - Игнорировать предупреждения о нестандартных таблицах
Параметры запуска индексатора
indexer [OPTIONS] [indexname1 [indexname2 [...]]]
  • --all - Перестраивает все таблицы из конфигурации
  • --buildstops - Анализирует источник таблицы так, как при индексации данных, создавая список индексируемых терминов
  • --buildfreqs - Добавляет счётчик частоты в таблицу для --buildstops
  • --config, -c - Указывает путь к конфигурационному файлу
  • --dump-rows - Выгружает строки, извлечённые из SQL источника(-ов), в указанный файл
  • --help - Показывает все доступные параметры
  • --keep-attrs - Позволяет повторно использовать существующие атрибуты при переиндексации
  • --keep-attrs-names - Задаёт, какие атрибуты использовать из существующей таблицы
  • --merge-dst-range - Применяет заданный диапазон фильтрации при слиянии
  • --merge-killlists - Изменяет обработку списка исключений при слиянии таблиц
  • --merge - Объединяет две простые таблицы в одну
  • --nohup - Предотвращает отправку индексатором сигнала SIGHUP при включении данной опции
  • --noprogress - Скрывает подробности прогресса
  • --print-queries - Выводит SQL-запросы, отправляемые индексатором в базу данных
  • --print-rt - Показывает данные, полученные из SQL источника(-ов), в виде INSERT-запросов в таблицу реального времени
  • --quiet - Подавляет весь вывод
  • --rotate - Запускает вращение таблиц после сборки всех таблиц
  • --sighup-each - Запускает вращение каждой таблицы сразу после её сборки
  • -v - Отображает версию индексатора

Конвертер таблиц для Manticore v2 / Sphinx v2

index_converter — это инструмент, предназначенный для конвертации таблиц, созданных с помощью Sphinx/Manticore Search 2.x, в формат таблиц Manticore Search 3.x.

index_converter {--config /path/to/config|--path}
Начальные параметры конвертера таблиц
  • --config, -c - Путь к файлу конфигурации таблицы
  • --index - Указывает, какую таблицу конвертировать
  • --path - Устанавливает путь, содержащий таблицу(ы), вместо файла конфигурации
  • --strip-path - Удаляет путь из имён файлов, на которые ссылается таблица
  • --large-docid - Позволяет конвертировать документы с идентификаторами больше 2^63
  • --output-dir - Записывает новые файлы в указанную папку
  • --all - Конвертирует все таблицы из файла конфигурации / пути
  • --killlist-target - Устанавливает целевые таблицы для применения kill-листов

searchd — это сервер Manticore.

Настройки Searchd в файле конфигурации

Для размещения в секции searchd {} файла конфигурации:

  • access_blob_attrs - Определяет способ доступа к файлу blob-атрибутов таблицы
  • access_doclists - Определяет способ доступа к файлу doclists таблицы
  • access_hitlists - Определяет способ доступа к файлу hitlists таблицы
  • access_plain_attrs - Определяет способ доступа поискового сервера к простым атрибутам таблицы
  • access_dict - Определяет способ доступа к файлу словаря таблицы
  • agent_connect_timeout - Таймаут подключения к удаленному агенту
  • agent_query_timeout - Таймаут запроса к удаленному агенту
  • agent_retry_count - Определяет количество попыток подключения и запроса к удаленным агентам, которые предпринимает Manticore
  • agent_retry_delay - Определяет задержку перед повторной попыткой запроса к удаленному агенту в случае сбоя
  • attr_flush_period - Устанавливает период времени между сбросом обновленных атрибутов на диск
  • binlog_flush - Режим сброса/синхронизации транзакций бинарного лога
  • binlog_max_log_size - Максимальный размер файла бинарного лога
  • binlog_common - Общий файл бинарного лога для всех таблиц
  • binlog_filename_digits - Количество цифр в имени файла бинарного лога
  • binlog_flush - Стратегия сброса бинарного лога
  • binlog_path - Путь к файлам бинарного лога
  • client_timeout - Максимальное время ожидания между запросами при использовании постоянных соединений
  • collation_libc_locale - Локаль libc сервера
  • collation_server - Коллация сервера по умолчанию
  • data_dir - Путь к каталогу данных, где Manticore хранит все данные (RT-режим)
  • diskchunk_flush_write_timeout - Таймаут автоматического сброса RAM-чанка, если в него не было записей
  • diskchunk_flush_search_timeout - Таймаут предотвращения автоматического сброса RAM-чанка, если в таблице не было поисковых запросов
  • docstore_cache_size - Максимальный размер блоков документов из хранилища документов, хранящихся в памяти
  • expansion_limit - Максимальное количество расширенных ключевых слов для одного символа подстановки
  • grouping_in_utc - Включает использование часового пояса UTC для группировки временных полей
  • ha_period_karma - Размер окна статистики зеркал агентов
  • ha_ping_interval - Интервал между пингами зеркал агентов
  • hostname_lookup - Стратегия обновления имен хостов
  • jobs_queue_size - Определяет максимальное количество "задач", разрешенных в очереди одновременно
  • join_batch_size - Определяет размер пакета для объединения таблиц для баланса производительности и использования памяти
  • join_cache_size - Определяет размер кэша для повторного использования результатов запросов JOIN
  • kibana_version_string – Строка версии сервера, отправляемая в ответ на запросы Kibana
  • listen - Определяет IP-адрес и порт или путь к Unix-доменному сокету для прослушивания searchd
  • listen_backlog - Размер очереди прослушивания TCP
  • listen_tfo - Включает флаг TCP_FASTOPEN для всех слушателей
  • log - Путь к файлу журнала сервера Manticore
  • max_batch_queries - Ограничивает количество запросов в пакете
  • max_connections - Максимальное количество активных соединений
  • max_filters - Максимально допустимое количество фильтров на запрос
  • max_filter_values - Максимально допустимое количество значений на фильтр
  • max_open_files - Максимальное количество файлов, разрешенных для открытия сервером
  • max_packet_size - Максимально допустимый размер сетевого пакета
  • mysql_version_string - Строка версии сервера, возвращаемая по протоколу MySQL
  • net_throttle_accept - Определяет, сколько клиентов принимается на каждой итерации сетевого цикла
  • net_throttle_action - Определяет, сколько запросов обрабатывается на каждой итерации сетевого цикла
  • net_wait_tm - Управляет интервалом активного цикла сетевого потока
  • net_workers - Количество сетевых потоков
  • network_timeout - Сетевой таймаут для запросов клиентов
  • node_address - Определяет сетевой адрес узла
  • persistent_connections_limit - Максимальное количество одновременных постоянных соединений с удаленными постоянными агентами
  • pid_file - Путь к pid-файлу сервера Manticore
  • predicted_time_costs - Затраты для модели прогнозирования времени выполнения запроса
  • preopen_tables - Определяет, следует ли принудительно предварительно открывать все таблицы при запуске
  • pseudo_sharding - Включает псевдошардинг для поисковых запросов к обычным и реального времени таблицам
  • qcache_max_bytes - Максимальный объем оперативной памяти, выделенный для кэшированных наборов результатов
  • qcache_thresh_msec - Минимальный порог реального времени для кэширования результата запроса
  • qcache_ttl_sec - Срок действия кэшированного набора результатов
  • query_log - Путь к файлу журнала запросов
  • query_log_format - Формат журнала запросов
  • query_log_min_msec - Предотвращает логирование слишком быстрых запросов
  • query_log_mode - Режим прав доступа к файлу журнала запросов
  • read_buffer_docs - Размер буфера чтения на ключевое слово для списков документов
  • read_buffer_hits - Размер буфера чтения на ключевое слово для списков попаданий
  • read_unhinted - Размер чтения без подсказок
  • rt_flush_period - Как часто Manticore сбрасывает RAM-чанки таблиц реального времени на диск
  • rt_merge_iops - Максимальное количество операций ввода-вывода (в секунду), разрешенное для потока слияния чанков реального времени
  • rt_merge_maxiosize - Максимальный размер операции ввода-вывода, разрешенный для потока слияния чанков реального времени
  • seamless_rotate - Предотвращает простои searchd при ротации таблиц с огромными объемами данных для предварительного кэширования
  • secondary_indexes - Включает использование вторичных индексов для поисковых запросов
  • server_id - Идентификатор сервера, используемый как начальное значение для генерации уникального идентификатора документа
  • shutdown_timeout - Таймаут --stopwait для searchd
  • shutdown_token - SHA1-хэш пароля, необходимого для вызова команды shutdown из VIP SQL-соединения
  • skiplist_cache_size - Максимальный размер кэша в памяти для распакованных списков пропуска
  • snippets_file_prefix - Префикс, добавляемый к локальным именам файлов при генерации сниппетов в режиме load_files
  • sphinxql_state - Путь к файлу, в который будет сериализовано текущее состояние SQL
  • sphinxql_timeout - Максимальное время ожидания между запросами от клиента MySQL
  • ssl_ca - Путь к файлу сертификата центра сертификации SSL
  • ssl_cert - Путь к SSL-сертификату сервера
  • ssl_key - Путь к ключу SSL-сертификата сервера
  • subtree_docs_cache - Максимальный размер кэша документов общего поддерева
  • subtree_hits_cache - Максимальный размер кэша попаданий общего поддерева, на запрос
  • timezone - Часовой пояс, используемый функциями, связанными с датой/временем
  • thread_stack - Максимальный размер стека для задачи
  • unlink_old - Удалять ли копии таблиц .old при успешной ротации
  • watchdog - Включить или отключить сторожевой таймер сервера Manticore
Параметры запуска searchd
searchd [OPTIONS]
  • --config, -c - Задает путь к файлу конфигурации
  • --console - Принудительно запускает сервер в консольном режиме
  • --coredump - Включает сохранение дампа памяти при аварийном завершении
  • --cpustats - Включает отчетность о времени процессора
  • --delete - Удаляет службу Manticore из консоли управления Microsoft и других мест, где регистрируются службы
  • --force-preread - Запрещает серверу обслуживать входящие соединения до предварительного чтения файлов таблиц
  • --help, -h - Отображает все доступные параметры
  • --quiet, -q - Выводить только ошибки при запуске
  • --table (--index) - Ограничивает сервер обслуживанием только указанной таблицы
  • --install - Устанавливает searchd как службу в консоли управления Microsoft
  • --iostats - Включает отчетность о вводе/выводе
  • --listen, -l - Переопределяет listen из файла конфигурации
  • --logdebug, --logdebugv, --logdebugvv - Включает дополнительный отладочный вывод в журнал сервера
  • --logreplication - Включает дополнительный отладочный вывод по репликации в журнал сервера
  • --new-cluster - Инициализирует кластер репликации и устанавливает сервер в качестве опорного узла с защитой от перезапуска кластера
  • --new-cluster-force - Инициализирует кластер репликации и устанавливает сервер в качестве опорного узла, обходя защиту от перезапуска кластера
  • --nodetach - Удерживает searchd работающим на переднем плане
  • --ntservice - Используется консолью управления Microsoft для запуска searchd как службы на платформах Windows
  • --pidfile - Переопределяет pid_file в файле конфигурации
  • --port, p - Задает порт, на котором должен слушать searchd, игнорируя порт, указанный в файле конфигурации
  • --replay-flags - Устанавливает дополнительные параметры воспроизведения бинарного лога
  • --servicename - Присваивает searchd заданное имя при установке или удалении службы, как оно отображается в консоли управления Microsoft
  • --status - Запрашивает статус у запущенной службы search
  • --stop - Останавливает сервер Manticore
  • --stopwait - Корректно останавливает сервер Manticore
  • --strip-path - Удаляет имена путей из всех имен файлов, на которые ссылается таблица
  • -v - Отображает информацию о версии
Переменные окружения searchd

Различные функции обслуживания таблиц, полезные для устранения неполадок.

indextool <command> [options]
Параметры запуска Indextool

Используется для вывода различных отладочных данных, связанных с физической таблицей.

indextool <command> [options]
  • --config, -c - Указывает путь к файлу конфигурации
  • --quiet, -q - Отключает вывод информационного баннера indextool и др.
  • --help, -h - Показывает все доступные параметры
  • -v - Отображает информацию о версии
  • Indextool - Проверяет файл конфигурации
  • --buildidf - Создает IDF-файл из одного или нескольких дампов словаря
  • --build-infixes - Создает инфиксы для существующей таблицы dict=keywords
  • --dumpheader - Быстро выводит предоставленный файл заголовка таблицы
  • --dumpconfig - Выводит определение таблицы из указанного файла заголовка таблицы в формате почти совместимом с manticore.conf
  • --dumpheader - Выводит заголовок таблицы по имени таблицы с поиском пути к заголовку в файле конфигурации
  • --dumpdict - Выводит словарь таблицы
  • --dumpdocids - Выводит идентификаторы документов по имени таблицы
  • --dumphitlist - Выводит все вхождения указанного ключевого слова/ID в заданной таблице
  • --docextract - Выполняет проверку таблицы на всем словаре/документах/вхождениях и собирает все слова и вхождения, относящиеся к запрошенному документу
  • --fold - Тестирует токенизацию на основе настроек таблицы
  • --htmlstrip - Фильтрует STDIN используя настройки удаления HTML для указанной таблицы
  • --mergeidf - Объединяет несколько файлов .idf в один файл
  • --morph - Применяет морфологию к предоставленному STDIN и выводит результат в stdout
  • --check - Проверяет файлы данных таблицы на целостность
  • --check-id-dups - Проверяет на дублирование идентификаторов
  • --check-disk-chunk - Проверяет один диск-чанк RT-таблицы
  • --strip-path - Удаляет пути из всех имен файлов, на которые ссылается таблица
  • --rotate - Определяет, проверять ли таблицу в ожидании ротации при использовании --check
  • --apply-killlists - Применяет kill-листы ко всем таблицам, перечисленным в файле конфигурации

Разделяет составные слова на компоненты.

wordbreaker [-dict path/to/dictionary_file] {split|test|bench}
Параметры запуска Wordbreaker
  • STDIN - Принимает строку для разбивки на части
  • -dict - Указывает файл словаря для использования
  • split|test|bench - Указывает команду

Извлекает содержимое файла словаря в формате ispell или MySpell

spelldump [options] <dictionary> <affix> [result] [locale-name]
  • dictionary - Главный файл словаря
  • affix - Файл аффиксов для словаря
  • result - Указывает место вывода данных словаря
  • locale-name - Указывает локаль для использования

Список зарезервированных ключевых слов

Полный алфавитный список ключевых слов, в настоящее время зарезервированных в синтаксисе Manticore SQL (поэтому их нельзя использовать как идентификаторы).

AND, AS, BY, COLUMNARSCAN, DISTINCT, DIV, DOCIDINDEX, EXPLAIN, FACET, FALSE, FORCE, FROM, IGNORE, IN, INDEXES, INNER, IS, JOIN, KNN, LEFT, LIMIT, MOD, NOT, NO_COLUMNARSCAN, NO_DOCIDINDEX, NO_SECONDARYINDEX, NULL, OFFSET, ON, OR, ORDER, RELOAD, SECONDARYINDEX, SELECT, SYSFILTERS, TRUE

Документация по старым версиям Manticore

Last modified: February 07, 2026