Защита и уплотнение таблицы > Уплотнение таблицы

FLUSH RAMCHUNK rt_table

Команда FLUSH RAMCHUNK создает новый дисковый чанк в RT-таблице.

Обычно RT-таблица автоматически сбрасывает и преобразует содержимое RAM-чанка в новый дисковый чанк при выполнении одного из специальных условий. Однако в некоторых случаях может потребоваться вручную инициировать сброс — и оператор FLUSH RAMCHUNK позволяет это сделать.

‹›

SQL

📋

FLUSH RAMCHUNK rt;

‹›

Response

Query OK, 0 rows affected (0.05 sec)

Сброс RT-таблицы на диск

Last modified: August 28, 2025

FLUSH TABLE rt_table

FLUSH TABLE принудительно записывает содержимое RAM-куска таблицы RT на диск.

Кусок RAM реального времени таблицы RT автоматически сбрасывается на диск во время корректного завершения работы или периодически каждые rt_flush_period секунд.

Выполнение команды FLUSH TABLE не только принудительно записывает содержимое RAM-куска на диск, но и запускает очистку бинарных логов.

‹›

SQL

📋

FLUSH TABLE rt;

‹›

Response

Query OK, 0 rows affected (0.05 sec)

Сброс RAM-чанка в новый диск-чанк Уплотнение таблицы

Last modified: August 28, 2025

Со временем RT-таблицы могут фрагментироваться на множество дисковых чанков и/или содержать удаленные, но не очищенные данные, что влияет на производительность поиска. В таких случаях необходима оптимизация. По сути, процесс оптимизации объединяет дисковые чанки (N-путевое слияние), удаляя документы, которые ранее были удалены с помощью операторов DELETE.

Начиная с Manticore 4, этот процесс происходит автоматически по умолчанию. Однако вы также можете использовать следующие команды для ручного запуска компактизации таблицы.

OPTIMIZE TABLE table_name [OPTION opt_name = opt_value [,...]]

Оператор OPTIMIZE добавляет RT-таблицу в очередь оптимизации, которая будет обработана в фоновом потоке.

‹›

SQL

📋

OPTIMIZE TABLE rt;

По умолчанию OPTIMIZE объединяет дисковые чанки RT-таблицы до количества, меньшего или равного количеству логических ядер CPU, умноженному на 2.

Однако, если таблица имеет атрибуты с KNN-индексами, этот порог отличается. В этом случае он устанавливается равным количеству физических ядер CPU, деленному на 2, для повышения производительности KNN-поиска.

Вы также можете управлять количеством оптимизированных дисковых чанков вручную с помощью опции cutoff.

Дополнительные опции включают:

Настройку сервера optimize_cutoff для переопределения порога по умолчанию
Настройку для конкретной таблицы optimize_cutoff

‹›

SQL

📋

OPTIMIZE TABLE rt OPTION cutoff=4;

При использовании OPTION sync=1 (по умолчанию 0) команда будет ждать завершения процесса оптимизации перед возвратом. Если соединение прервется, оптимизация продолжит выполняться на сервере.

‹›

SQL

📋

OPTIMIZE TABLE rt OPTION sync=1;

Оптимизация может быть длительным и ресурсоемким процессом ввода-вывода. Оператор OPTIMIZE добавляет задание в пул фоновых воркеров. Вы можете контролировать, сколько заданий выполняется параллельно, с помощью parallel_chunk_merges, и сколько чанков объединяет каждое задание, с помощью merge_chunks_per_job. Воркеры оптимизации могут быть ограничены по вводу-выводу, и вы можете контролировать максимальное количество операций ввода-вывода в секунду и максимальный размер операции ввода-вывода с помощью директив rt_merge_iops и rt_merge_maxiosize соответственно.

Во время оптимизации оптимизируемая RT-таблица остается онлайн и доступной как для поиска, так и для обновлений почти все время. Она блокируется на очень короткий период, когда пара дисковых чанков успешно объединяется, что позволяет переименовать старые и новые файлы и обновить заголовок таблицы.

Пока auto_optimize не отключен, таблицы оптимизируются автоматически.

Если вы сталкиваетесь с неожиданными SST или хотите, чтобы таблицы на всех узлах кластера были бинарно идентичными, вам необходимо:

Отключить auto_optimize.
Вручную оптимизировать таблицы:

На одном из узлов удалить таблицу из кластера:

‹›

SQL

📋

ALTER CLUSTER mycluster DROP myindex;

Оптимизировать таблицу:

‹›

SQL

📋

OPTIMIZE TABLE myindex;

Добавить таблицу обратно в кластер:

‹›

SQL

📋

ALTER CLUSTER mycluster ADD myindex;

Когда таблица добавляется обратно, новые файлы, созданные в процессе оптимизации, будут реплицированы на другие узлы кластера. Любые локальные изменения, внесенные в таблицу на других узлах, будут потеряны.

Модификации данных таблицы (вставки, замены, удаления, обновления) должны либо:

Быть отложены, либо
Направляться на узел, где выполняется процесс оптимизации.

Обратите внимание, что пока таблица находится вне кластера, команды insert/replace/delete/update должны ссылаться на нее без префикса имени кластера (для SQL-запросов или свойства cluster в случае HTTP JSON запроса), иначе они завершатся ошибкой. После того как таблица будет добавлена обратно в кластер, вы должны возобновить операции записи в таблицу и снова включать префикс имени кластера, иначе они завершатся ошибкой.

Операции поиска доступны как обычно в процессе на любом из узлов.

Сброс RT-таблицы на диск Изоляция при сбросе и слиянии

Last modified: May 22, 2026

Manticore обеспечивает изоляцию во время процессов слива и слияния таблицы в реальном времени, чтобы предотвратить влияние изменений на выполняющиеся запросы.

Например, во время уплотнения таблицы объединяется пара дисковых чанков, и создаётся новый чанк. В какой-то момент создаётся новая версия таблицы с новым чанком, заменяющим исходную пару. Это происходит бесшовно, так что длительно выполняющийся запрос, использующий исходные чанки, продолжит видеть старую версию таблицы, а новый запрос увидит новую версию с объединённым чанком.

То же самое касается слива RAM-чанка, где подходящие сегменты RAM объединяются в новый дисковый чанк, а участвующие сегменты RAM-чанка игнорируются. Во время этой операции Manticore обеспечивает изоляцию для запросов, которые начались до начала операции.

Кроме того, эти операции прозрачны для replace и update. Если вы обновляете атрибут в документе, который принадлежит дисковому чанку, объединяемому с другим, обновление будет применено как к этому чанку, так и к результирующему объединённому чанку. Если вы удаляете документ во время слияния, он будет удалён в исходном чанке и также в результирующем объединённом чанке, где документ либо будет помечен как удалённый, либо вообще отсутствовать, если удаление произошло на ранней стадии процесса слияния.

Уплотнение таблицы Заморозка и блокировка таблицы

Last modified: August 28, 2025

Сброс RAM-чанка в новый дисковый чанк

FLUSH RAMCHUNK

Запись куска RAM в файл

FLUSH TABLE

Компактизация таблицы

OPTIMIZE TABLE

Количество оптимизированных дисковых чанков

Запуск в foreground режиме

Ограничение влияния на ввод-вывод

Оптимизация кластерных таблиц

Изоляция во время слива и слияния