Гибридный поиск

Когда Manticore выполняет полносканирующий запрос, он может либо использовать простой скан для проверки каждого документа с учётом фильтров, либо применять дополнительные данные и/или алгоритмы для ускорения выполнения запроса. Manticore использует оптимизатор на основе стоимости (CBO), также известный как «оптимизатор запросов», для определения подходящего способа.

CBO также может улучшать производительность полнотекстовых запросов. Подробнее см. ниже.

CBO может решить заменить один или несколько фильтров запроса одним из следующих элементов, если он определит, что это улучшит производительность:

docid индекс использует специальный вторичный индекс только docid, хранящийся в файлах с расширением .spt. Помимо улучшения фильтров по идентификаторам документов, docid индекс также используется для ускорения поиска идентификатора строки по идентификатору документа и для ускорения применения больших killlist при запуске демона.
колоночное сканирование опирается на колоночное хранение и может использоваться только на колоночном атрибуте. Оно сканирует каждое значение и проверяет его по фильтру, но при этом сильно оптимизировано и обычно быстрее подхода по умолчанию.
вторичные индексы создаются по умолчанию для всех атрибутов (кроме JSON). Они используют PGM индекс вместе с встроенным инвертированным индексом Manticore для получения списка идентификаторов строк, соответствующих значению или диапазону значений. Вторичные индексы хранятся в файлах с расширениями .spidx и .spjidx. Для информации о том, как создавать вторичные индексы по JSON атрибутам, см. json_secondary_indexes.

Оптимизатор оценивает стоимость каждого пути выполнения, используя различные статистики атрибутов, включая:

Информацию о распределении данных внутри атрибута (гистограммы, хранящиеся в файлах .sphi). Гистограммы создаются автоматически при индексации данных и служат основным источником информации для CBO.
Информацию от PGM (вторичных индексов), которая помогает оценить количество списков документов для чтения. Это помогает оценить производительность объединения doclist и выбрать подходящий алгоритм слияния (слияние с приоритетной очередью или слияние битмапов).
Статистику кодирования колонок, используемую для оценки производительности декомпрессии колоночных данных.
Колоночное дерево min-max. В то время как CBO использует гистограммы для оценки количества документов, остающихся после применения фильтра, он также должен определить, сколько документов фильтр пришлось обработать. Для колоночных атрибутов частичная оценка min-max дерева служит этой цели.
Полнотекстовый словарь. CBO использует статистику терминов для оценки стоимости вычисления полнотекстового дерева.

Оптимизатор вычисляет стоимость выполнения для каждого фильтра, используемого в запросе. Поскольку некоторые фильтры могут быть заменены несколькими разными элементами (например, для идентификатора документа Manticore может использовать простой скан, поиск по docid индексу, колоночное сканирование (если идентификатор документа колоночный) и вторичный индекс), оптимизатор оценивает все доступные комбинации. Однако существует максимальный лимит в 1024 комбинации.

Для оценки стоимости выполнения запроса оптимизатор рассчитывает предполагаемые стоимости наиболее значимых операций, выполняемых при выполнении запроса. Он использует предустановленные константы для представления стоимости каждой операции.

Оптимизатор сравнивает стоимости каждого пути выполнения и выбирает путь с наименьшей стоимостью для выполнения запроса.

При работе с полнотекстовыми запросами, которые содержат фильтры по атрибутам, оптимизатор запросов выбирает один из двух возможных путей выполнения. Либо выполнить полнотекстовый запрос, получить совпадения и применить фильтры. Либо заменить фильтры одним или несколькими элементами, описанными выше, получить из них rowid и внедрить их в полнотекстовое дерево. Таким образом результаты полнотекстового поиска пересекутся с результатами полносканирования. Оптимизатор оценивает стоимость вычисления полнотекстового дерева и наилучший возможный путь вычисления результатов фильтра. Используя эту информацию, оптимизатор выбирает путь выполнения.

Ещё один фактор — многопоточное выполнение запросов (когда включён pseudo_sharding). CBO знает, что некоторые запросы могут выполняться в нескольких потоках, и учитывает это. CBO отдаёт предпочтение более короткому времени выполнения запроса (то есть задержке) по сравнению с пропускной способностью. Например, если запрос с использованием колоночного сканирования может быть выполнен в нескольких потоках (и занять несколько ядер CPU) и при этом быстрее, чем запрос, выполненный в одном потоке с использованием вторичных индексов, будет предпочтительным многопоточное выполнение.

Запросы с использованием вторичных индексов и docid индексов всегда выполняются в одном потоке, поскольку бенчмарки показывают, что многопоточность для них малоэффективна.

На данный момент оптимизатор учитывает только затраты CPU и не принимает во внимание использование памяти или диска.

Векторный поиск K-ближайших соседей

Last modified: August 28, 2025

Manticore Search поддерживает возможность добавления эмбеддингов, сгенерированных моделями машинного обучения, к каждому документу, а затем выполнение поиска ближайших соседей по ним. Это позволяет создавать такие функции, как поиск по сходству, рекомендации, семантический поиск и ранжирование по релевантности на основе алгоритмов NLP, среди прочего, включая поиск по изображениям, видео и звуку.

Чтобы объединить векторный поиск KNN с полнотекстовым поиском для повышения релевантности, см. Гибридный поиск.

Эмбеддинг — это метод представления данных — таких как текст, изображения или звук — в виде векторов в многомерном пространстве. Эти векторы созданы таким образом, чтобы расстояние между ними отражало сходство представляемых ими данных. Этот процесс обычно использует алгоритмы, такие как word embeddings (например, Word2Vec, BERT) для текста или нейронные сети для изображений. Многомерная природа векторного пространства, со многими компонентами на вектор, позволяет представлять сложные и тонкие взаимосвязи между элементами. Их сходство измеряется расстоянием между этими векторами, часто с использованием методов, таких как евклидово расстояние или косинусное сходство.

Manticore Search позволяет выполнять поиск по векторам методом k-ближайших соседей (KNN) с использованием библиотеки HNSW. Эта функциональность является частью Manticore Columnar Library.

Для выполнения поиска KNN необходимо сначала настроить вашу таблицу. Векторы с плавающей точкой и поиск KNN поддерживаются только в таблицах реального времени (не в обычных таблицах). Таблица должна иметь хотя бы один атрибут типа float_vector, который служит вектором данных. Необходимо указать следующие свойства:

knn_type: Обязательная настройка; в настоящее время поддерживается только hnsw.
knn_dims: Обязательная настройка, определяющая размерность индексируемых векторов.
hnsw_similarity: Обязательная настройка, определяющая функцию расстояния, используемую индексом HNSW. Допустимые значения:
- L2 - Квадрат L2
- IP - Скалярное произведение
- COSINE - Косинусное сходство
Примечание: При использовании сходства COSINE векторы автоматически нормализуются при вставке. Это означает, что сохраненные значения векторов могут отличаться от исходных входных значений, так как они будут преобразованы в единичные векторы (векторы с математической длиной/величиной 1.0) для обеспечения эффективных вычислений косинусного сходства. Эта нормализация сохраняет направление вектора, стандартизируя его длину.
hnsw_m: Необязательная настройка, определяющая максимальное количество исходящих соединений в графе. По умолчанию 16.
hnsw_ef_construction: Необязательная настройка, определяющая компромисс между временем построения и точностью. По умолчанию 200.

‹›

SQL
Config

📋

create table test ( title text, image_vector float_vector knn_type='hnsw' knn_dims='4' hnsw_similarity='l2' );

‹›

Response

Query OK, 0 rows affected (0.01 sec)

Самый простой способ работы с векторными данными — использование автоэмбеддингов. С этой функцией вы создаете таблицу с параметрами MODEL_NAME и FROM, а затем просто вставляете свои текстовые данные — Manticore автоматически генерирует эмбеддинги для вас.

При создании таблицы для автоэмбеддингов укажите:

MODEL_NAME: Модель эмбеддингов для использования
FROM: Какие поля использовать для генерации эмбеддингов (пустое значение означает все текстовые/строковые поля)
API_KEY: Требуется для удаленных моделей (OpenAI, Voyage, Jina). Ключ API проверяется при создании таблицы путем выполнения реального API-запроса.
API_URL: Опционально. Пользовательский URL конечной точки API. Если не указан, используется конечная точка провайдера по умолчанию (например, https://api.openai.com/v1/embeddings для OpenAI).
API_TIMEOUT: Опционально. HTTP-таймаут в секундах для API-запросов. По умолчанию 10 секунд. Установите '0', чтобы использовать таймаут по умолчанию. Применяется как к запросам проверки при создании таблицы, так и к генерации эмбеддингов во время операций INSERT.

Поддерживаемые модели эмбеддингов:

Тип модели	Пример	Требуется API-ключ	Примечания
Sentence Transformers	`sentence-transformers/all-MiniLM-L6-v2`	Нет	Локальные модели на основе BERT, автоматически загружаются
Qwen	`Qwen/Qwen3-Embedding-0.6B`	Нет	Локальные модели семейства Qwen
Llama	`TinyLlama/TinyLlama-1.1B-Chat-v1.0`	Нет	Локальные модели семейства Llama
Mistral	`Locutusque/TinyMistral-248M-v2`	Нет	Локальные модели семейства Mistral
Gemma	`h2oai/embeddinggemma-300m`	Нет	Локальные модели семейства Gemma
OpenAI	`openai/text-embedding-ada-002`	Да	`API_KEY='<OPENAI_API_KEY>'`
Voyage	Модели Voyage AI	Да	`API_KEY='<VOYAGE_API_KEY>'`
Jina	Модели Jina AI	Да	`API_KEY='<JINA_API_KEY>'`

Требования к формату локальных моделей:

Должны быть сохранены в формате safetensors (только однофайловый)
Поддерживаемые семейства: Qwen, Llama, Mistral, Gemma
Протестированные модели: TinyLlama/TinyLlama-1.1B-Chat-v1.0, Locutusque/TinyMistral-248M-v2, Qwen/Qwen3-Embedding-0.6B, h2oai/embeddinggemma-300m
Другие модели safetensors также могут работать, но не гарантируется

Больше информации о настройке атрибута float_vector можно найти здесь.

‹›

SQL
Config

📋

Использование sentence-transformers (API-ключ не требуется)

CREATE TABLE products (
    title TEXT,
    description TEXT,
    embedding_vector FLOAT_VECTOR KNN_TYPE='hnsw' HNSW_SIMILARITY='l2'
    MODEL_NAME='sentence-transformers/all-MiniLM-L6-v2' FROM='title'
);

Использование локальных эмбеддингов Qwen (API-ключ не требуется)

CREATE TABLE products_qwen (
    title TEXT,
    description TEXT,
    embedding_vector FLOAT_VECTOR KNN_TYPE='hnsw' HNSW_SIMILARITY='l2'
    MODEL_NAME='Qwen/Qwen3-Embedding-0.6B' FROM='title' CACHE_PATH='/opt/homebrew/var/manticore/.cache/manticore'
);

Использование OpenAI (требуется параметр API_KEY)

CREATE TABLE products_openai (
    title TEXT,
    description TEXT,
    embedding_vector FLOAT_VECTOR KNN_TYPE='hnsw' HNSW_SIMILARITY='l2'
    MODEL_NAME='openai/text-embedding-ada-002' FROM='title,description' API_KEY='...'
);

Использование OpenAI с пользовательским URL API и таймаутом (опционально)

CREATE TABLE products_openai_custom (
    title TEXT,
    description TEXT,
    embedding_vector FLOAT_VECTOR KNN_TYPE='hnsw' HNSW_SIMILARITY='l2'
    MODEL_NAME='openai/text-embedding-ada-002' FROM='title,description'
    API_KEY='...' API_URL='https://custom-api.example.com/v1/embeddings' API_TIMEOUT='30'
);

Использование всех текстовых полей для эмбеддингов (FROM пуст)

CREATE TABLE products_all (
    title TEXT,
    description TEXT,
    embedding_vector FLOAT_VECTOR KNN_TYPE='hnsw' HNSW_SIMILARITY='l2'
    MODEL_NAME='sentence-transformers/all-MiniLM-L6-v2' FROM=''
);

table products {
    type = rt
    path = /path/to/products
    rt_field = title
    rt_field = description
    rt_attr_float_vector = embedding_vector
    knn = {"attrs":[{"name":"embedding_vector","type":"hnsw","hnsw_similarity":"L2","hnsw_m":16,"hnsw_ef_construction":200,"model_name":"sentence-transformers/all-MiniLM-L6-v2","from":"title"}]}
}

Использование OpenAI с API-ключом в обычном режиме:

table products_openai {
    type = rt
    path = /path/to/products_openai
    rt_field = title
    rt_field = description
    rt_attr_float_vector = embedding_vector
    knn = {"attrs":[{"name":"embedding_vector","type":"hnsw","hnsw_similarity":"L2","hnsw_m":16,"hnsw_ef_construction":200,"model_name":"openai/text-embedding-ada-002","from":"title,description","api_key":"your-api-key-here"}]}
}

Использование всех текстовых полей (пустой FROM):

table products_all {
    type = rt
    path = /path/to/products_all
    rt_field = title
    rt_field = description
    rt_attr_float_vector = embedding_vector
    knn = {"attrs":[{"name":"embedding_vector","type":"hnsw","hnsw_similarity":"L2","hnsw_m":16,"hnsw_ef_construction":200,"model_name":"sentence-transformers/all-MiniLM-L6-v2","from":""}]}
}

Важные примечания для обычного режима:

При использовании model_name вы не должны указывать dims — модель автоматически определяет размерность векторов. Параметры dims и model_name являются взаимоисключающими.
Когда вы не используете model_name (ручная вставка векторов), вы должны указать dims, чтобы обозначить размерность векторов.
Параметр from указывает, какие поля использовать для генерации эмбеддингов (список, разделенный запятыми, или пустая строка для всех текстовых/строковых полей). Этот параметр обязателен при использовании model_name.
Для API-моделей (OpenAI, Voyage, Jina) включите параметр api_key в конфигурацию knn

При использовании автоматических эмбеддингов вы можете:

Пропустить векторное поле и позволить Manticore сгенерировать эмбеддинги из полей, перечисленных в FROM
Явно предоставить собственный вектор для строки
Указать (), чтобы пропустить генерацию и сохранить вектор, состоящий из нулей

Если позже вы запустите ALTER TABLE ... REBUILD EMBEDDINGS, строки, которые в данный момент содержат нулевые векторы из (), также будут перегенерированы.

‹›

SQL

📋

Вставить только текстовые данные — эмбеддинги генерируются автоматически

INSERT INTO products (title) VALUES
('machine learning artificial intelligence'),
('banana fruit sweet yellow');

Вставить вектор, предоставленный пользователем

INSERT INTO products (title, embedding_vector) VALUES
('machine learning artificial intelligence', (0.653448,0.192478,0.017971,0.339821));

Вставить несколько полей — оба используются для создания эмбеддинга, если FROM='title,description'

INSERT INTO products_openai (title, description) VALUES
('smartphone', 'latest mobile device with advanced features'),
('laptop', 'portable computer for work and gaming');

Вставить пустой вектор (без автоматической генерации; сохраняется нулевой вектор)

INSERT INTO products (title, embedding_vector) VALUES
('no embedding item', ());

Поиск работает аналогичным образом — предоставьте ваш текстовый запрос, и Manticore сгенерирует эмбеддинги и найдет похожие документы:

‹›

SQL
JSON

📋

SELECT id, knn_dist() FROM products WHERE knn(embedding_vector, 'machine learning');

‹›

Response

+------+------------+
| id   | knn_dist() |
+------+------------+
|    1 | 0.12345678 |
|    2 | 0.87654321 |
+------+------------+
2 rows in set (0.00 sec)

В качестве альтернативы вы можете вручную вставлять предварительно вычисленные векторные данные, убедившись, что они соответствуют размерности, указанной вами при создании таблицы. Вы также можете вставить пустой вектор; это означает, что документ будет исключен из результатов векторного поиска.

Важно: При использовании hnsw_similarity='cosine' векторы автоматически нормализуются при вставке в единичные векторы (векторы с математической длиной/величиной 1.0). Эта нормализация сохраняет направление вектора, стандартизируя его длину, что необходимо для эффективных вычислений косинусного сходства. Это означает, что сохраненные значения будут отличаться от ваших исходных входных значений.

‹›

SQL
JSON

📋

insert into test values ( 1, 'yellow bag', (0.653448,0.192478,0.017971,0.339821) ), ( 2, 'white bag', (-0.148894,0.748278,0.091892,-0.095406) );

‹›

Response

Query OK, 2 rows affected (0.00 sec)

Теперь вы можете выполнить KNN-поиск, используя предложение knn в формате SQL или JSON. Оба интерфейса поддерживают одинаковые основные параметры, обеспечивая согласованный опыт независимо от выбранного формата:

SQL: select ... from <table name> where knn ( <field>, <query vector> [,<options>] )

JSON:

POST /search
{
    "table": "<table name>",
    "knn":
    {
        "field": "<field>",
        "query": "<text or vector>",
        "ef": <ef>,
        "rescore": <rescore>,
        "oversampling": <oversampling>
    }
}

Параметры:

field: Имя атрибута вектора с плавающей запятой, содержащего векторные данные.
k: Устаревшая опция. Используйте limit в запросе. Ранее использовалась для указания количества документов, которое должен вернуть один индекс HNSW. Однако фактическое количество документов, включенных в окончательные результаты, может варьироваться. Например, если система работает с таблицами реального времени, разделенными на дисковые чанки, каждый чанк может вернуть k документов, что приводит к общему количеству, превышающему указанное k (так как совокупное количество будет num_chunks * k). С другой стороны, окончательное количество документов может быть меньше k, если после запроса k документов некоторые из них отфильтровываются на основе определенных атрибутов. Важно отметить, что параметр k не применяется к ramchunks. В контексте ramchunks процесс извлечения работает иначе, и поэтому влияние параметра k на количество возвращаемых документов неприменимо.
query: (Рекомендуемый параметр) Поисковый запрос, который может быть:
- Текстовой строкой: Автоматически преобразуется в эмбеддинги, если для поля настроены автоматические эмбеддинги. Вернет ошибку, если у поля нет автоматических эмбеддингов.
- Векторным массивом: Работает так же, как query_vector.
query_vector: (Устаревший параметр) Поисковый вектор в виде массива чисел. Все еще поддерживается для обратной совместимости. Примечание: Используйте либо query, либо query_vector, но не оба в одном запросе.
ef: необязательный размер динамического списка, используемого во время поиска. Более высокое значение ef приводит к более точному, но более медленному поиску. По умолчанию равно 10.
rescore: Включает повторное вычисление релевантности для KNN (включено по умолчанию). Установите 0 в SQL или false в JSON, чтобы отключить повторное вычисление. После завершения KNN-поиска с использованием квантованных векторов (с возможным передискретизацией) расстояния пересчитываются с исходными (полноразрядными) векторами, и результаты пересортировываются для повышения точности ранжирования.
oversampling: Устанавливает коэффициент (значение с плавающей запятой), на который умножается k при выполнении KNN-поиска, что приводит к извлечению большего количества кандидатов, чем необходимо, с использованием квантованных векторов. По умолчанию применяется oversampling=3.0. Эти кандидаты могут быть позже переоценены, если повторное вычисление релевантности включено. Передискретизация также работает с неквантованными векторами. Поскольку она увеличивает k, что влияет на работу индекса HNSW, это может вызвать небольшое изменение точности результатов.
early_termination: Включает или отключает адаптивное раннее завершение во время обхода графа HNSW. Включено по умолчанию. Установите 0 в SQL или false в JSON, чтобы отключить. Подробности см. в разделе Раннее завершение.

Документы всегда сортируются по расстоянию до поискового вектора. Любые дополнительные критерии сортировки, которые вы укажете, будут применены после этого основного условия сортировки. Для получения расстояния существует встроенная функция knn_dist().

‹›

SQL
JSON

📋

select id, knn_dist() from test where knn ( image_vector, (0.286569,-0.031816,0.066684,0.032926), { ef=2000, oversampling=3.0, rescore=1 } );

‹›

Response

+------+------------+
| id   | knn_dist() |
+------+------------+
|    1 | 0.28146550 |
|    2 | 0.81527930 |
+------+------------+
2 rows in set (0.00 sec)

Индексы HNSW необходимо полностью загружать в память для выполнения поиска KNN, что может привести к значительному потреблению памяти. Чтобы уменьшить использование памяти, можно применить скалярное квантование — технику, которая сжимает высокоразмерные векторы, представляя каждую компоненту (измерение) ограниченным количеством дискретных значений. Manticore поддерживает 8-битное и 1-битное квантование, что означает сжатие каждой компоненты вектора с 32-битного числа с плавающей запятой до 8 бит или даже 1 бита, уменьшая использование памяти в 4 или 32 раза соответственно. Эти сжатые представления также позволяют выполнять более быстрые вычисления расстояний, так как больше компонент вектора может быть обработано за одну SIMD инструкцию. Хотя скалярное квантование вносит некоторую ошибку аппроксимации, это часто является оправданным компромиссом между точностью поиска и эффективностью использования ресурсов. Для ещё большей точности квантование можно комбинировать с пересчётом релевантности и избыточной выборкой: извлекается больше кандидатов, чем запрошено, и расстояния для этих кандидатов пересчитываются с использованием исходных 32-битных векторов с плавающей запятой.

Поддерживаемые типы квантования включают:

8bit: Каждая компонента вектора квантуется до 8 бит.
1bit: Каждая компонента вектора квантуется до 1 бита. Используется асимметричное квантование, при котором векторы запросов квантуются до 4 бит, а хранимые векторы — до 1 бита. Этот подход обеспечивает более высокую точность, чем более простые методы, хотя и с некоторым компромиссом в производительности.
1bitsimple: Каждая компонента вектора квантуется до 1 бита. Этот метод быстрее, чем 1bit, но обычно менее точен.

‹›

SQL

📋

create table test ( title text, image_vector float_vector knn_type='hnsw' knn_dims='4' hnsw_similarity='l2' quantization='1bit');

‹›

Response

Query OK, 0 rows affected (0.01 sec)

ПРИМЕЧАНИЕ: Поиск похожих документов по id требует наличия Manticore Buddy. Если это не работает, убедитесь, что Buddy установлен.

Поиск документов, похожих на конкретный, на основе его уникального ID, является распространённой задачей. Например, когда пользователь просматривает определённый элемент, Manticore Search может эффективно идентифицировать и отобразить список элементов, наиболее похожих на него в векторном пространстве. Вот как это можно сделать:

SQL: select ... from <table name> where knn ( <field>, <k>, <document id> )

JSON:

POST /search
{
    "table": "<table name>",
    "knn":
    {
        "field": "<field>",
        "doc_id": <document id>,
        "k": <k>
    }
}

Параметры:

field: Это имя атрибута вектора с плавающей запятой, содержащего векторные данные.
k: Это количество возвращаемых документов и ключевой параметр для индексов Hierarchical Navigable Small World (HNSW). Он указывает количество документов, которое должен вернуть один индекс HNSW. Однако фактическое количество документов, включённых в окончательные результаты, может варьироваться. Например, если система работает с таблицами реального времени, разделёнными на дисковые чанки, каждый чанк может вернуть k документов, что приводит к общему количеству, превышающему указанное k (так как совокупное количество будет num_chunks * k). С другой стороны, окончательное количество документов может быть меньше k, если после запроса k документов некоторые из них отфильтровываются на основе определённых атрибутов. Важно отметить, что параметр k не применяется к ramchunks. В контексте ramchunks процесс извлечения работает иначе, и, следовательно, влияние параметра k на количество возвращаемых документов неприменимо.
document id: ID документа для поиска сходства KNN.

‹›

SQL
JSON

📋

select id, knn_dist() from test where knn ( image_vector, 5, 1 );

‹›

Response

+------+------------+
| id   | knn_dist() |
+------+------------+
|    2 | 0.81527930 |
+------+------------+
1 row in set (0.00 sec)

Manticore также поддерживает дополнительную фильтрацию документов, возвращаемых поиском KNN, либо по полнотекстовому соответствию, либо по фильтрам атрибутов, либо по обоим.

‹›

SQL
JSON

📋

select id, knn_dist() from test where knn ( image_vector, 5, (0.286569,-0.031816,0.066684,0.032926) ) and match('white') and id < 10;

‹›

Response

+------+------------+
| id   | knn_dist() |
+------+------------+
|    2 | 0.81527930 |
+------+------------+
1 row in set (0.00 sec)

При комбинировании векторного поиска KNN с фильтрами атрибутов Manticore поддерживает две стратегии, которые отличаются тем, когда фильтр применяется относительно обхода графа HNSW.

Предфильтрация (по умолчанию; prefilter=1 (SQL) или "prefilter": true (JSON, по умолчанию)) передаёт фильтр непосредственно в сам обход HNSW. Каждый кандидат проверяется фильтром перед добавлением в кучу результатов — только соответствующие документы вносят вклад в итоговые k результатов. Это уменьшает бесполезные вычисления расстояний и гарантирует возврат ровно k соответствующих документов (при условии, что существует k соответствующих документов).
Постфильтрация (prefilter=0 (SQL) или "prefilter": false (JSON)) сначала выполняет поиск KNN по всему набору данных, а затем применяет фильтр к результатам. Это безопасно и предсказуемо: граф HNSW обходится без помех, и фильтр влияет только на то, какие результаты возвращаются клиенту. Недостаток в том, что граф может тратить усилия на кандидатов, которые в итоге будут отброшены. При жёстком фильтре, соответствующем лишь небольшой доле документов, возвращённых результатов k может быть значительно меньше запрошенного, потому что большинство кандидатов KNN не проходят фильтр.

Внутренне Manticore использует алгоритм на основе ACORN-1 для предварительной фильтрации. Наивная предварительная фильтрация просто пропускала бы несоответствующие узлы, что рискует потерей "мостовых" узлов, соединяющих иначе разделённые части графа HNSW, вызывая коллапс полноты при увеличении селективности фильтра. ACORN-1 избегает этого: когда узел не проходит фильтр, его соседи всё равно добавляются в очередь исследования. Это позволяет обходу обходить отфильтрованные узлы и поддерживать связность графа. Исследование ACORN-1 активируется автоматически, когда менее 60% от общего количества документов проходят фильтр.

Автоматический откат к полному перебору: При включенной предфильтрации Manticore оценивает, что будет дешевле: выполнить полный перебор расстояний по отфильтрованному подмножеству или обходить граф HNSW. Оценка сравнивает ожидаемое количество узлов, которые посетит HNSW, с количеством документов, прошедших фильтр. Если отфильтрованное множество достаточно мало, чтобы его прямое сканирование было быстрее, Manticore автоматически переключается на полный перебор, полностью пропуская HNSW. Это обеспечивает корректность и хорошую производительность даже при экстремальной селективности.

‹›

SQL
JSON

📋

-- prefilter (default): filter applied during HNSW traversal (ACORN-1 used automatically)
SELECT id, knn_dist() FROM test
WHERE knn ( image_vector, (0.286569,-0.031816,0.066684,0.032926) )
AND price < 100;
-- postfilter: KNN runs over full dataset, filter applied to results
SELECT id, knn_dist() FROM test
WHERE knn ( image_vector, (0.286569,-0.031816,0.066684,0.032926), { prefilter=0 } )
AND price < 100;

По умолчанию Manticore использует адаптивный алгоритм досрочного завершения во время обхода графа HNSW. Вместо того чтобы всегда исследовать полный набор кандидатов, определённый параметром ef, он отслеживает скорость, с которой новые кандидаты улучшают результирующий набор, и останавливается досрочно, когда эта скорость стабильно падает ниже порога. Это сокращает количество вычислений расстояний без значительного ухудшения качества результатов.

Досрочное завершение включено по умолчанию и автоматически отключается, когда k равно 10 или меньше, так как накладные расходы алгоритма не оправданы для таких маленьких результирующих наборов. Прирост производительности масштабируется с k — чем больше результирующий набор, тем больше вычислений расстояний можно сэкономить, остановившись раньше.

Обратите внимание, что передискретизация умножает эффективное k, используемое во время обхода HNSW, поэтому досрочное завершение также выигрывает от передискретизации: более высокое эффективное k означает больше кандидатов, которых потенциально можно пропустить.

Для явного управления досрочным завершением используйте опцию early_termination:

‹›

SQL
JSON

📋

-- disable early termination
SELECT id, knn_dist() FROM test WHERE knn ( image_vector, (0.286569,-0.031816,0.066684,0.032926), { ef=200, early_termination=0 } );
-- enable early termination explicitly (default)
SELECT id, knn_dist() FROM test WHERE knn ( image_vector, (0.286569,-0.031816,0.066684,0.032926), { ef=200, early_termination=1 } );

Когда следует отключать досрочное завершение:

Когда точность результирующего набора критически важна и вы не можете позволить себе никакого приближения сверх того, что уже предоставляет HNSW.
При использовании низких значений k (примерно 30 или меньше), где досрочное завершение даёт мало преимуществ в производительности, но может снизить точность.

Оптимизатор на основе стоимости Гибридный поиск

Last modified: May 16, 2026

Гибридный поиск объединяет полнотекстовый (BM25) поиск с KNN векторным поиском в одном запросе, объединяя результаты с использованием Reciprocal Rank Fusion (RRF). Это позволяет использовать сильные стороны обоих методов извлечения: точность по ключевым словам от BM25 и семантическое понимание от векторного сходства.

Полнотекстовый поиск отлично справляется с точным соответствием ключевых слов и редкими терминами, но упускает концептуально похожий контент. Векторный поиск улавливает семантическое значение, но может быть зашумленным на неоднозначных запросах. Гибридный поиск объединяет оба подхода, поэтому документы, которые хорошо оцениваются по любому или обоим сигналам, оказываются на поверхности.

RRF — это алгоритм слияния, основанный на рангах. Он работает с позициями рангов, а не с исходными оценками, что позволяет избежать необходимости нормализации несовместимых шкал оценок (оценки BM25 неограничены; расстояния KNN имеют другую шкалу).

RRF_score(d) = SUM over all result sets r:  weight_r / (rank_constant + rank_r(d))

Где:

d — это документ
rank_r(d) — это позиция документа (начиная с 1) в наборе результатов r (отсортированном по оценке этого извлекателя)
rank_constant — это константа сглаживания (по умолчанию: 60, настраивается через опцию rank_constant)
weight_r — это необязательный вес для каждого извлекателя (по умолчанию: 1.0)

Если документ не появляется в конкретном наборе результатов, его вклад от этого набора равен 0.

rank_constant=60 используется по умолчанию.
Меньшие значения (например, 10) усиливают различия между элементами с наивысшим рангом.
Более высокие значения (например, 100) распределяют влияние более равномерно по всем рангам.

Объедините MATCH(...) и KNN(...) в предложении WHERE с OPTION fusion_method='rrf':

‹›

SQL
JSON

📋

SELECT id, hybrid_score()
FROM t
WHERE match('machine learning')
  AND knn(vec, (0.1, 0.1, 0.1, 0.1))
OPTION fusion_method='rrf';

Это запускает текстовый поиск и KNN поиск как независимые параллельные подзапросы, а затем объединяет результаты с помощью RRF. Без fusion_method='rrf' запрос выполняется как обычный KNN поиск, отфильтрованный по текстовому соответствию (поведение до гибридного поиска).

hybrid_score() — оценка слияния RRF (доступна только в гибридных запросах)
weight() — оценка текстового соответствия BM25
knn_dist() — векторное расстояние (минимум по всем KNN подзапросам, если их несколько)

Опция	Тип	По умолчанию	Описание
`fusion_method`	строка	(нет)	Установите в `'rrf'`, чтобы включить гибридный поиск. Обязательно.
`rank_constant`	целое число	60	Константа сглаживания в формуле RRF
`window_size`	целое число	0 (авто)	Сколько результатов извлекает каждый подзапрос перед слиянием. При 0 вычисляется автоматически на основе KNN `k` (с передискретизацией) и `LIMIT` запроса
`fusion_weights`	кортеж	(все 1.0)	Веса для каждого подзапроса при оценке RRF

‹›

SQL
JSON

📋

-- Default rank_constant=60 (gentler ranking)
SELECT id, hybrid_score() FROM t
WHERE match('machine learning') AND knn(vec, (0.1, 0.1, 0.1, 0.1))
OPTION fusion_method='rrf';
-- rank_constant=10 (sharper top-rank differences)
SELECT id, hybrid_score() FROM t
WHERE match('machine learning') AND knn(vec, (0.1, 0.1, 0.1, 0.1))
OPTION fusion_method='rrf', rank_constant=10;

Стандартные фильтры WHERE работают вместе с гибридным поиском. Фильтры применяются как к текстовым, так и к KNN подзапросам:

‹›

SQL
JSON

📋

SELECT id, category, hybrid_score()
FROM t
WHERE match('machine learning')
  AND knn(vec, (0.1, 0.1, 0.1, 0.1))
  AND category = 1
OPTION fusion_method='rrf';

По умолчанию результаты сортируются по hybrid_score() DESC. Вы можете переопределить это:

‹›

SQL

📋

-- Sort by hybrid score ascending
SELECT id, hybrid_score() FROM t
WHERE match('machine learning') AND knn(vec, (0.1, 0.1, 0.1, 0.1))
ORDER BY hybrid_score() ASC
OPTION fusion_method='rrf';
-- Sort by text weight
SELECT id, weight() FROM t
WHERE match('machine learning') AND knn(vec, (0.1, 0.1, 0.1, 0.1))
ORDER BY weight() DESC, id ASC
OPTION fusion_method='rrf';
-- Sort by KNN distance
SELECT id, knn_dist() FROM t
WHERE match('machine learning') AND knn(vec, (0.1, 0.1, 0.1, 0.1))
ORDER BY knn_dist() ASC
OPTION fusion_method='rrf';

Если текстовый запрос не соответствует ни одному документу, только результаты KNN вносят вклад в оценку RRF:

SELECT id, hybrid_score() FROM t
WHERE match('xyznonexistent') AND knn(vec, (0.1, 0.1, 0.1, 0.1))
OPTION fusion_method='rrf';
-- Returns results ranked purely by KNN rank

Один гибридный запрос может объединять текстовый поиск с несколькими KNN поисками по разным векторным атрибутам. Все они объединяются через RRF:

‹›

SQL
JSON

📋

-- Three-way fusion: text + vec1 KNN + vec2 KNN
SELECT id, hybrid_score()
FROM t
WHERE match('machine learning')
  AND knn(vec1, (0.1, 0.1, 0.1, 0.1))
  AND knn(vec2, (1.0, 0.0, 0.0, 0.0))
OPTION fusion_method='rrf';
-- KNN-only fusion (no text), two vector searches
SELECT id, hybrid_score()
FROM t
WHERE knn(vec1, (0.1, 0.1, 0.1, 0.1))
  AND knn(vec2, (1.0, 0.0, 0.0, 0.0))
OPTION fusion_method='rrf';

Несколько KNN поисков без fusion_method приводят к ошибке.

По умолчанию все подзапросы вносят равный вклад (вес 1.0). Чтобы придать разную важность текстовому и KNN поискам, используйте fusion_weights с явными псевдонимами:

‹›

SQL
JSON

📋

SELECT id, hybrid_score()
FROM t
WHERE match('machine learning') AS text
  AND knn(vec1, (0.1, 0.1, 0.1, 0.1)) AS dense1
  AND knn(vec2, (1.0, 0.0, 0.0, 0.0)) AS dense2
OPTION fusion_method='rrf',
       fusion_weights=(text=0.7, dense1=0.2, dense2=0.1);

SQL:

Используйте AS alias для MATCH(...) и KNN(...), чтобы дать им имена. Неявных/псевдонимов по умолчанию нет.
Пропущенные псевдонимы по умолчанию имеют вес 1.0.
Ссылка на несуществующий псевдоним приводит к ошибке.

JSON:

"query" — это фиксированный псевдоним для полнотекстового подзапроса.
Псевдонимы KNN устанавливаются через свойство "name" для каждой записи KNN.
Запись KNN с именем "query" конфликтует с текстовым псевдонимом и приводит к ошибке.
Неявные псевдонимы (имена полей без явного "name") не поддерживаются в fusion_weights.

Вы можете указать веса только для некоторых подзапросов; остальные по умолчанию будут иметь вес 1.0:

-- Only boost text, KNN searches default to weight 1.0
SELECT id, hybrid_score()
FROM t
WHERE match('machine learning') AS text
  AND knn(vec1, (0.1, 0.1, 0.1, 0.1)) AS dense1
  AND knn(vec2, (1.0, 0.0, 0.0, 0.0)) AS dense2
OPTION fusion_method='rrf', fusion_weights=(text=2.0);

Для таблиц с настроенными авто-эмбеддингами на атрибуте float_vector, hybrid_match() предоставляет сокращенную запись, которая автоматически запускает как текстовый, так и KNN поиск из одной строки запроса:

‹›

SQL

📋

-- Explicit vector field
SELECT id, hybrid_score() FROM t WHERE hybrid_match('machine learning', vec);
-- Auto-detect vector field (requires exactly one auto-embedding attribute)
SELECT id, hybrid_score() FROM t WHERE hybrid_match('machine learning');
-- With custom k and rank_constant
SELECT id, hybrid_score() FROM t
WHERE hybrid_match('machine learning', vec, {k=3})
OPTION rank_constant=10;
-- With attribute filter
SELECT id, hybrid_score() FROM t
WHERE hybrid_match('machine learning', vec) AND category=1;

hybrid_match() автоматически:

Выполняет текстовый запрос как полнотекстовый поиск BM25
Генерирует эмбеддинг из той же текстовой строки
Выполняет KNN поиск с использованием этого эмбеддинга
Объединяет результаты через RRF

Требование: Векторный атрибут должен иметь настроенные model_name и from для авто-эмбеддингов. Без них hybrid_match() возвращает ошибку.

Для таблиц с авто-эмбеддингами свойство "hybrid" предоставляет сокращенную запись в JSON:

‹›

JSON

JSON

📋

⚙

POST /search
{
  "table": "hj",
  "hybrid": { "query": "machine learning" }
}
POST /search
{
  "table": "hj",
  "hybrid": { "query": "machine learning", "field": "vec" }
}
POST /search
{
  "table": "hj",
  "hybrid": { "query": "machine learning" },
  "options": { "rank_constant": 10 }
}

Свойство "hybrid" не может использоваться вместе с "knn".

Когда векторный атрибут имеет авто-эмбеддинги, вы можете использовать "query" (строка) вместо "query_vector" (массив) в объекте knn:

POST /search
{
  "table": "ht",
  "knn": { "field": "vec", "query": "machine learning", "k": 5 },
  "query": { "match": { "title": "machine learning" } },
  "options": { "fusion_method": "rrf" }
}

Строка автоматически преобразуется в эмбеддинг во время выполнения запроса. Без настроенных авто-эмбеддингов это возвращает ошибку.

Внутренне гибридный запрос разделяется на N+1 параллельных подзапросов:

Задача 0: Полнотекстовый (BM25) подзапрос (пропускается, если текстовый запрос пуст, чтобы избежать загрязнения RRF результатами полного сканирования)
Задачи 1..N: Один KNN подзапрос на каждую запись knn(...)

Все подзапросы выполняются параллельно. После завершения всех, RRF-слияние:

Собирает ранжированные результаты из каждого подзапроса
Для каждого документа накапливает вклады в оценку RRF от каждого подзапроса, в котором он появляется
Сортирует по объединенной оценке RRF по убыванию
Устанавливает knn_dist() равной минимальному расстоянию по всем KNN подзапросам для каждого документа
Сохраняет weight() из текстового подзапроса

Векторный поиск K-ближайших соседей Обновление схемы и настроек таблицы

Last modified: March 23, 2026

ALTER TABLE table ADD COLUMN column_name [{INTEGER|INT|BIGINT|FLOAT|BOOL|MULTI|MULTI64|JSON [secondary_index='1']|STRING|TEXT [INDEXED [ATTRIBUTE]]|TIMESTAMP|FLOAT_VECTOR [KNN options]}] [engine='columnar']
ALTER TABLE table DROP COLUMN column_name
ALTER TABLE table MODIFY COLUMN column_name bigint

Эта функция поддерживает добавление только одного поля за раз для RT-таблиц или расширение столбца int до bigint. Поддерживаемые типы данных:

int - целочисленный атрибут
timestamp - атрибут временной метки
bigint - атрибут большого целого числа
float - атрибут с плавающей запятой
bool - булев атрибут
multi - многозначный целочисленный атрибут
multi64 - многозначный атрибут bigint
json - атрибут json; используйте secondary_index='1' для создания вторичного индекса по JSON
string / text attribute / string attribute - строковый атрибут
text / text indexed stored / string indexed stored - полнотекстовое индексируемое поле с исходным значением, хранящимся в docstore
text indexed / string indexed - полнотекстовое индексируемое поле, только индексируемое (исходное значение не хранится в docstore)
text indexed attribute / string indexed attribute - полнотекстовое индексируемое поле + строковый атрибут (исходное значение не хранится в docstore)
text stored / string stored - значение будет храниться только в docstore, не полнотекстово индексироваться и не является строковым атрибутом
float_vector - векторный атрибут. Вы можете использовать те же опции KNN и авто-встраивания, что и в CREATE TABLE
добавление engine='columnar' к любому атрибуту (кроме json) приведет к его хранению в колоночном хранилище

❗Рекомендуется создать резервную копию файлов таблицы перед выполнением ALTER, чтобы избежать повреждения данных в случае внезапного отключения питания или других подобных проблем.
Запросы к таблице невозможны, пока добавляется столбец.
Вновь созданные скалярные атрибуты устанавливаются в 0.
Вновь добавленные столбцы float_vector без MODEL_NAME инициализируются нулевыми векторами.
Если вы добавляете столбец float_vector с MODEL_NAME и FROM, существующие строки автоматически встраиваются во время выполнения ALTER TABLE ... ADD COLUMN.
Когда указан MODEL_NAME, требуется FROM. Используйте FROM='' для встраивания из всех полей text и строковых атрибутов.
ALTER не будет работать для распределенных таблиц и таблиц без каких-либо атрибутов.
Нельзя удалить столбец id.
При удалении поля, которое одновременно является полнотекстовым полем и строковым атрибутом, первый ALTER DROP удаляет атрибут, второй — полнотекстовое поле.
Добавление/удаление полнотекстового поля поддерживается только в режиме RT.

‹›

Example

Example

📋

mysql> desc rt;
+------------+-----------+
| Field      | Type      |
+------------+-----------+
| id         | bigint    |
| text       | field     |
| group_id   | uint      |
| date_added | timestamp |
+------------+-----------+
mysql> alter table rt add column test integer;
mysql> desc rt;
+------------+-----------+
| Field      | Type      |
+------------+-----------+
| id         | bigint    |
| text       | field     |
| group_id   | uint      |
| date_added | timestamp |
| test       | uint      |
+------------+-----------+
mysql> alter table rt drop column group_id;
mysql> desc rt;
+------------+-----------+
| Field      | Type      |
+------------+-----------+
| id         | bigint    |
| text       | field     |
| date_added | timestamp |
| test       | uint      |
+------------+-----------+
mysql> alter table rt add column title text indexed;
mysql> desc rt;
+------------+-----------+------------+
| Field      | Type      | Properties |
+------------+-----------+------------+
| id         | bigint    |            |
| text       | text      | indexed    |
| title      | text      | indexed    |
| date_added | timestamp |            |
| test       | uint      |            |
+------------+-----------+------------+
mysql> alter table rt add column title text attribute;
mysql> desc rt;
+------------+-----------+------------+
| Field      | Type      | Properties |
+------------+-----------+------------+
| id         | bigint    |            |
| text       | text      | indexed    |
| title      | text      | indexed    |
| date_added | timestamp |            |
| test       | uint      |            |
| title      | string    |            |
+------------+-----------+------------+
mysql> alter table rt drop column title;
mysql> desc rt;
+------------+-----------+------------+
| Field      | Type      | Properties |
+------------+-----------+------------+
| id         | bigint    |            |
| text       | text      | indexed    |
| title      | text      | indexed    |
| date_added | timestamp |            |
| test       | uint      |            |
+------------+-----------+------------+
mysql> alter table rt drop column title;
mysql> desc rt;
+------------+-----------+------------+
| Field      | Type      | Properties |
+------------+-----------+------------+
| id         | bigint    |            |
| text       | text      | indexed    |
| date_added | timestamp |            |
| test       | uint      |            |
+------------+-----------+------------+

ALTER TABLE table ft_setting='value'[, ft_setting2='value']

Вы можете использовать ALTER для изменения полнотекстовых настроек вашей таблицы в режиме RT. Однако это влияет только на новые документы, а не на существующие. Пример:

создаем таблицу с полнотекстовым полем и charset_table, которая позволяет только 3 поисковых символа: a, b и c.
затем мы вставляем документ 'abcd' и находим его по запросу abcd, d просто игнорируется, так как его нет в массиве charset_table
затем мы понимаем, что хотим, чтобы d тоже был доступен для поиска, поэтому добавляем его с помощью ALTER
но тот же запрос where match('abcd') все равно говорит, что поиск был по abc, потому что существующий документ помнит предыдущее содержимое charset_table
затем мы добавляем еще один документ abcd и снова ищем по abcd
теперь он находит оба документа, и show meta говорит, что использовалось два ключевых слова: abc (для поиска старого документа) и abcd (для нового).

‹›

Example

Example

📋

mysql> create table rt(title text) charset_table='a,b,c';
mysql> insert into rt(title) values('abcd');
mysql> select * from rt where match('abcd');
+---------------------+-------+
| id                  | title |
+---------------------+-------+
| 1514630637682688054 | abcd  |
+---------------------+-------+
mysql> show meta;
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| total         | 1     |
| total_found   | 1     |
| time          | 0.000 |
| keyword[0]    | abc   |
| docs[0]       | 1     |
| hits[0]       | 1     |
+---------------+-------+
mysql> alter table rt charset_table='a,b,c,d';
mysql> select * from rt where match('abcd');
+---------------------+-------+
| id                  | title |
+---------------------+-------+
| 1514630637682688054 | abcd  |
+---------------------+-------+
mysql> show meta
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| total         | 1     |
| total_found   | 1     |
| time          | 0.000 |
| keyword[0]    | abc   |
| docs[0]       | 1     |
| hits[0]       | 1     |
+---------------+-------+
mysql> insert into rt(title) values('abcd');
mysql> select * from rt where match('abcd');
+---------------------+-------+
| id                  | title |
+---------------------+-------+
| 1514630637682688055 | abcd  |
| 1514630637682688054 | abcd  |
+---------------------+-------+
mysql> show meta;
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| total         | 2     |
| total_found   | 2     |
| time          | 0.000 |
| keyword[0]    | abc   |
| docs[0]       | 1     |
| hits[0]       | 1     |
| keyword[1]    | abcd  |
| docs[1]       | 1     |
| hits[1]       | 1     |
+---------------+-------+

Вы можете изменить имя реальной таблицы в режиме RT.

ALTER TABLE table_name RENAME new_table_name;

ПРИМЕЧАНИЕ: Переименование реальной таблицы требует наличия Manticore Buddy. Если это не работает, убедитесь, что Buddy установлен.

‹›

Example

Example

📋

ALTER TABLE table_name RENAME new_table_name;

‹›

Response

Query OK, 0 rows affected (0.00 sec)

ALTER TABLE table RECONFIGURE

ALTER также может перенастроить RT-таблицу в обычном режиме, чтобы новые настройки токенизации, морфологии и другие настройки обработки текста из файла конфигурации вступили в силу для новых документов. Обратите внимание, что существующие документы останутся нетронутыми. Внутренне он принудительно сохраняет текущий RAM-чанк как новый дисковый чанк и корректирует заголовок таблицы, чтобы новые документы токенизировались с использованием обновленных полнотекстовых настроек.

‹›

Example

Example

📋

mysql> show table rt settings;
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| settings      |       |
+---------------+-------+
1 row in set (0.00 sec)
mysql> alter table rt reconfigure;
Query OK, 0 rows affected (0.00 sec)
mysql> show table rt settings;
+---------------+----------------------+
| Variable_name | Value                |
+---------------+----------------------+
| settings      | morphology = stem_en |
+---------------+----------------------+
1 row in set (0.00 sec)

ALTER TABLE table REBUILD SECONDARY

Вы также можете использовать ALTER для перестроения вторичных индексов в заданной таблице. Иногда вторичный индекс может быть отключен для всей таблицы или для одного или нескольких атрибутов внутри таблицы:

Когда атрибут обновляется, его вторичный индекс отключается.
Если Manticore загружает таблицу со старой версией вторичных индексов, которая больше не поддерживается, вторичные индексы будут отключены для всей таблицы.

ALTER TABLE table REBUILD SECONDARY перестраивает вторичные индексы из данных атрибутов и снова включает их.

Кроме того, старая версия вторичных индексов может поддерживаться, но будет лишена определенных функций. REBUILD SECONDARY можно использовать для обновления вторичных индексов.

‹›

Example

Example

📋

ALTER TABLE rt REBUILD SECONDARY;

‹›

Response

Query OK, 0 rows affected (0.00 sec)

ALTER TABLE table REBUILD KNN

Команда перерабатывает все векторные данные в таблице и перестраивает KNN-индекс с нуля.

‹›

Example

Example

📋

ALTER TABLE rt REBUILD KNN;

‹›

Response

Query OK, 0 rows affected (0.00 sec)

ALTER TABLE table REBUILD EMBEDDINGS column_name

Эта команда повторно генерирует встраивания для одного целевого столбца float_vector, у которого настроены MODEL_NAME и FROM.

Используйте его, когда требуется перестроить векторы для существующей колонки с эмбеддингами, например, при необходимости повторной обработки строк после добавления колонки позже с помощью ALTER TABLE ... ADD COLUMN, или когда нужно принудительно перегенерировать все строки.

Важное поведение:

Имя колонки обязательно. Команда перестраивает одну колонку с эмбеддингами за раз.
Она заново генерирует эмбеддинги для всех строк в этой колонке, а не только для строк с нулевыми векторами.
Она также перезаписывает строки, векторы которых были вставлены вручную, и строки, где использовалось () для пропуска генерации и сохранения нулевого вектора.
Целевая колонка должна быть индексированным float_vector с настроенной моделью эмбеддингов.
FROM='' разрешено и означает "использовать все поля text и атрибуты string".

Manticore не сохраняет информацию о том, был ли текущий вектор в этой колонке сгенерирован автоматически, предоставлен явно пользователем или создан из (). Если вы запустите REBUILD EMBEDDINGS, сохранённые значения будут перегенерированы из настроенного источника FROM для каждой строки в колонке, включая строки, чьё текущее значение является полностью нулевым вектором.

‹›

Example

Example

📋

ALTER TABLE products ADD COLUMN embedding FLOAT_VECTOR KNN_TYPE='hnsw' HNSW_SIMILARITY='l2' MODEL_NAME='sentence-transformers/all-MiniLM-L6-v2' FROM='title';
ALTER TABLE products REBUILD EMBEDDINGS embedding;

‹›

Response

Query OK, 0 rows affected (0.00 sec)

ALTER может использоваться для изменения параметров API, когда для авто-эмбеддингов используется удалённая модель:

ALTER TABLE table_name MODIFY COLUMN column_name API_KEY='key';
ALTER TABLE table_name MODIFY COLUMN column_name API_URL='url';
ALTER TABLE table_name MODIFY COLUMN column_name API_TIMEOUT='seconds';

‹›

Example

Example

📋

ALTER TABLE rt MODIFY COLUMN vector API_KEY='new-key';
ALTER TABLE rt MODIFY COLUMN vector API_URL='https://custom-api.example.com/v1/embeddings';
ALTER TABLE rt MODIFY COLUMN vector API_TIMEOUT='30';

Примечания:

API_KEY: Новый API-ключ проверяется во время операции ALTER путём выполнения реального API-запроса.
API_URL: Установите в пустую строку (''), чтобы вернуться к конечной точке провайдера по умолчанию.
API_TIMEOUT: Установите в '0', чтобы использовать таймаут по умолчанию (10 секунд). Должно быть неотрицательным целым числом.

Чтобы изменить список локальных или удаленных узлов в распределенной таблице, используйте тот же синтаксис, который вы использовали для создания таблицы. Просто замените CREATE на ALTER в команде и удалите type='distributed':

ALTER TABLE `distr_table_name` [[local='local_table_name'], [agent='host:port:remote_table'] ... ]

ПРИМЕЧАНИЕ: Изменение схемы распределенной таблицы онлайн требует наличия Manticore Buddy. Если это не работает, убедитесь, что Buddy установлен.

‹›

Example

Example

📋

ALTER TABLE local_dist local='index1' local='index2' agent='127.0.0.1:9312:remote_table';

Гибридный поиск

Last modified: March 27, 2026

Оптимизатор на основе стоимости

Поиск по векторам методом k-ближайших соседей

Что такое эмбеддинг?

Настройка таблицы для поиска KNN

Вставка векторных данных

Автоэмбеддинги (Рекомендуется)

Создание таблицы с автоэмбеддингами

Вставка данных с автоматическими эмбеддингами

Поиск с автоматическими эмбеддингами

Ручная вставка векторов

KNN векторный поиск

Квантование векторов

Поиск похожих документов по id

Фильтрация результатов векторного поиска KNN

Стратегии фильтрации: предварительная фильтрация vs. последующая фильтрация

Досрочное завершение

Reciprocal Rank Fusion (RRF)

Формула

Параметр rank_constant

Базовый гибридный запрос

Доступные функции

Опции

Настройка rank_constant

Фильтры атрибутов

Сортировка

Несоответствующий текст

Несколько KNN поисков

Взвешенное слияние (fusion_weights)

Правила псевдонимов

Частичные веса

Упрощенный синтаксис: hybrid_match()

Упрощенный синтаксис JSON: hybrid

Авто-эмбеддинг KNN в гибридных запросах

Архитектура выполнения

Обновление схемы таблицы

Обновление схемы таблицы в режиме RT

Важные замечания:

Обновление FT-настроек таблицы в режиме RT

Переименование реальной таблицы

Обновление FT-настроек таблицы в обычном режиме

Перестроение вторичного индекса

Перестроение KNN-индекса

Перестроение встраиваний

Обновление параметров API атрибутов (для генерации эмбеддингов) в режиме RT

Изменение распределенной таблицы