lemmatizer_base — это необязательная директива конфигурации, которая указывает базовый путь для словарей лемматизатора. Путь по умолчанию — /usr/share/manticore
Реализация лемматизатора в Manticore Search (см. Morphology, чтобы узнать, что такое лемматизаторы) основана на словарях и требует конкретных файлов словарей для разных языков. Эти файлы можно скачать с сайта Manticore (https://manticoresearch.com/install/#other-downloads).
Пример:
lemmatizer_base = /usr/share/manticore/
progressive_merge — это директива конфигурации, которая при включении объединяет дисковые чанки реального времени таблицы от меньших к большим. Такой подход ускоряет процесс слияния и уменьшает усиление при чтении/записи. По умолчанию эта настройка включена. Если выключена, чанки объединяются в порядке их создания.
json_autoconv_keynames — это необязательная директива конфигурации, которая определяет, нужно ли и как автоматически конвертировать имена ключей в JSON-атрибутах. Известное значение — 'lowercase'. По умолчанию эта настройка не задана (то есть конвертация не происходит).
При установке значения lowercase имена ключей в JSON-атрибутах будут автоматически преобразованы в нижний регистр при индексировании. Эта конвертация применяется к JSON-атрибутам из всех источников данных, включая SQL и XMLpipe2.
Пример:
json_autoconv_keynames = lowercase
json_autoconv_numbers — это необязательная директива конфигурации, которая определяет, следует ли автоматически обнаруживать и конвертировать JSON-строки, представляющие числа, в числовые атрибуты. Значение по умолчанию — 0 (не конвертировать строки в числа).
Если эта опция установлена в 1, такие значения, как "1234", будут индексироваться как числа, а не строки. Если опция установлена в 0, такие значения будут индексироваться как строки. Эта конвертация применяется к JSON-атрибутам из всех источников данных, включая SQL и XMLpipe2.
Пример:
json_autoconv_numbers = 1
on_json_attr_error — это необязательная директива конфигурации, которая задаёт действие при обнаружении ошибок формата JSON. Значение по умолчанию — ignore_attr (игнорировать ошибки). Эта настройка применяется только к атрибутам sql_attr_json.
По умолчанию ошибки формата JSON игнорируются (ignore_attr), и инструмент индексирования выводит предупреждение. Установка этой опции в fail_index приведёт к остановке индексирования при первой ошибке формата JSON.
Пример:
on_json_attr_error = ignore_attr
plugin_dir — это необязательная директива конфигурации, которая задаёт доверенное расположение для динамических библиотек (UDF). Путь по умолчанию — /usr/local/lib/manticore/.
Эта директива задаёт доверенную директорию, из которой могут загружаться библиотеки UDF.
Пример:
plugin_dir = /usr/local/lib/manticore/