创建集群 > 设置复制 | Manticore Search Manual

Agent 镜像在处理搜索查询时可以互换使用。托管定义镜像代理的分布式表的 Manticore 实例会跟踪镜像状态（存活或宕机）和响应时间，并基于这些信息执行自动故障切换和负载均衡。

agent = node1|node2|node3:9312:shard2

上述示例声明 node1:9312、node2:9312 和 node3:9312 都有一个名为 shard2 的表，并且可以作为可互换的镜像使用。如果这些服务器中的任何一个宕机，查询将分配给剩下的两个。当服务器恢复上线时，主节点会检测到并开始再次将查询路由到所有三个节点。

镜像也可以包含单独的表列表，如下所示：

agent = node1:9312:node1shard2|node2:9312:node2shard2

这与前面的示例类似，但对不同服务器查询时会使用不同的表名。例如，查询 node1:9312 时将使用 node1shard2，查询 node2:9312 时将使用 node2shard。

默认情况下，所有查询都路由到最优的镜像。最优镜像是基于最近的统计数据选择的，由配置指令 ha_period_karma 控制。主节点存储每个代理的指标（总查询数、错误数、响应时间等），并按时间段分组。这些时间段的长度就是 karma。最优代理镜像动态依据最近两个时间段确定。选择镜像的具体算法可以通过 ha_strategy 指令配置。

karma 时间段以秒为单位，默认是 60 秒。主节点为监控目的存储最多 15 个带有每代理统计的 karma 时间段（参见 SHOW AGENT STATUS 语句）。然而，HA/LB 逻辑只使用这些中的最后两个时间段。

当没有查询时，主节点每 ha_ping_interval 毫秒定期发送 ping 命令，以收集统计信息并检查远程主机是否仍然存活。ha_ping_interval 默认是 1000 毫秒。设置为 0 会禁用 ping，统计将仅基于实际查询累计。

示例：

# sharding table over 4 servers total
# in just 2 shards but with 2 failover mirrors for each shard
# node1, node2 carry shard1 as local
# node3, node4 carry shard2 as local
# config on node1, node2
agent = node3:9312|node4:9312:shard2
# config on node3, node4
agent = node1:9312|node2:9312:shard1

载均衡

Last modified: August 28, 2025

对于使用镜像的分布式表，默认开启负载均衡。默认情况下，查询会随机分布到各个镜像上。您可以使用ha_strategy来更改此行为。

ha_strategy = {random|nodeads|noerrors|roundrobin}

负载均衡的镜像选择策略是可选的，默认设置为 random。

用于镜像选择的策略，换句话说，就是在分布式表中选择特定的代理镜像，由此指令控制。实质上，该指令控制主节点如何在配置的镜像代理节点间执行负载均衡。实现了以下几种策略：

默认的均衡模式是在线性随机分布中简单地在镜像间分配。这意味着每个镜像被赋予相等的选择概率。这类似于轮询（RR），但不强制执行严格的选择顺序。

‹›

Example

Example

📋

ha_strategy = random

默认的简单随机策略没有考虑镜像的状态、错误率，最重要的是实际响应延迟。为了解决异构集群和代理节点负载的临时峰值，存在一组基于主节点实际观察到的查询延迟动态调整概率的均衡策略。

基于延迟加权概率的自适应策略工作原理如下：

延迟统计以 ha_period_karma 秒为单位累积。
延迟加权概率每个 karma 周期重新计算一次。
“存活或死亡”标志每次请求，包括 ping 请求时调整。

初始时概率相等。每一步概率按上一个 karma 周期内观察到的延迟的倒数进行缩放，然后归一化。例如，在主节点启动后前 60 秒内，4 个镜像的延迟分别为 10 毫秒、5 毫秒、30 毫秒和 3 毫秒，第一次调整步骤如下：

初始百分比：0.25, 0.25, 0.25, 0.25。
观察到的延迟：10 ms, 5 ms, 30 ms, 3 ms。
延迟倒数：0.1, 0.2, 0.0333, 0.333。
缩放后的百分比：0.025, 0.05, 0.008333, 0.0833。
归一化百分比：0.15, 0.30, 0.05, 0.50。

这意味着，在下一个 karma 周期内，第一个镜像被选中的概率为 15%，第二个为 30%，第三个（最慢，30 毫秒）仅为 5%，第四个（最快，3 毫秒）为 50%。之后，第二次调整步骤会再次更新这些概率，依此类推。

其思想是，一旦观察到的延迟稳定，延迟加权概率也会稳定。所有这些调整迭代旨在收敛到一个点，使得所有镜像的平均延迟大致相等。

延迟加权概率，但排除“死亡”的镜像。“死亡”镜像定义为连续发生多次硬错误（如网络故障或无响应等）的镜像。

‹›

Example

Example

📋

ha_strategy = nodeads

延迟加权概率，但排除错误率较高的镜像。

‹›

Example

Example

📋

ha_strategy = noerrors

简单轮询选择，即依次选择列表中的第一个镜像、第二个镜像、第三个镜像，依此类推，直到最后一个镜像，然后重复该过程。与随机策略不同，轮询施加严格的查询顺序（1, 2, 3, ..., N-1, N, 1, 2, 3, ...），并保证不会连续将两个查询发送至同一个镜像。

‹›

Example

Example

📋

ha_strategy = roundrobin

ha_period_karma = 2m

ha_period_karma 定义代理镜像统计窗口的大小，单位为秒（或带时间后缀）。可选，默认值为 60。

对于带代理镜像的分布式表，服务器会跟踪多个不同的每镜像计数器。服务器基于这些计数器进行故障转移和负载均衡。（服务器根据计数器选择最佳镜像使用。）计数器在 ha_period_karma 秒的区块中累积。

开始新计数块后，主节点可能在新块填充到一半之前仍使用之前块中累积的值。因此，任何先前的历史最多在 1.5 倍 ha_period_karma 秒后不再影响镜像选择。

虽然最多使用两个区块进行镜像选择，但实际上最多存储最近 15 个区块以支持工具分析。可通过 SHOW AGENT STATUS 语句查看。

ha_ping_interval = 3s

ha_ping_interval 指令定义发送给代理镜像的 ping 间隔，单位为毫秒（或带时间后缀）。该选项可选，默认值为 1000。

对于带代理镜像的分布式表，服务器在空闲期间向所有镜像发送 ping 命令以跟踪其当前状态（是否存活、网络往返时间等）。ping 发送间隔由 ha_ping_interval 配置决定。

如果想禁用 ping，可将 ha_ping_interval 设置为 0。

像设置复制

Last modified: August 28, 2025

使用 Manticore，写事务（例如 INSERT、REPLACE、DELETE、TRUNCATE、UPDATE、COMMIT）可以在当前节点完全应用事务之前复制到其他集群节点。目前，复制支持 Linux 和 macOS 下的 percolate、rt 和 distributed 表。

Manticore 的原生 Windows 二进制文件不支持复制。我们推荐通过 WSL（Windows 子系统 Linux）安装 Manticore。

在 macOS 上，复制支持有限，仅建议用于开发目的。

Manticore 的复制由 Galera 库提供支持，具有以下卓越功能：

真正的多主：随时可读取及写入任何节点。
几乎同步复制，无从属延迟及节点崩溃后无数据丢失。
热备份：切换时无停机（因为不存在故障转移）。
紧密耦合：所有节点保持相同状态，不允许节点间数据分歧。
自动节点配置：无需手动备份数据库并恢复到新节点。
易于使用和部署。
不可靠节点的检测及自动剔除。
基于认证的复制。

要在 Manticore Search 中设置复制：

配置文件中 "searchd" 部分必须设置 data_dir 选项。纯模式不支持复制。
必须指定一个包含其他节点可访问 IP 地址的 listen 指令，或一个有可访问 IP 的 node_address。
可以选择在每个集群节点上为 server_id 设置唯一值。如果未设置该值，节点将尝试使用 MAC 地址或随机数生成 server_id。

如果没有设置 replication 类型的 listen 指令，Manticore 将在默认协议监听端口之后的 200 端口范围内为每个创建的集群使用前两个空闲端口。若要手动设置复制端口，必须定义 listen 指令（类型为 replication）的端口范围，且同一服务器不同节点的地址/端口范围不能交叉。通常，端口范围应为每个集群指定至少两个端口。当定义带端口范围的复制监听器（例如 listen = 192.168.0.1:9320-9328:replication）时，Manticore 不会立即在这些端口监听。它仅在开始使用复制时，从指定范围内随机选取空闲端口。

复制集群是一组节点，其中写事务被复制。复制是按表设置的，即一张表只能属于一个集群。集群中表的数量没有限制。属于集群的任何 percolate 或实时表上的所有事务如 INSERT、REPLACE、DELETE、TRUNCATE 都会复制到该集群的所有其他节点。分布式表也可以参与复制过程。复制是多主的，因此对任何节点或多个节点同时写入均可正常工作。

创建集群通常使用命令 create cluster，命令格式是 CREATE CLUSTER <cluster name>，加入集群可以使用 join cluster，命令格式是 JOIN CLUSTER <cluster name> at 'host:port'。但在某些罕见情况下，可能需要微调 CREATE/JOIN CLUSTER 的行为。可用选项包括：

该选项指定集群的名称。应在所有集群中唯一。

注意： JOIN 命令允许的最大主机名长度为 253 字符，超出此限制将导致 searchd 报错。

该选项指定用于写集缓存复制和从其他节点接收表的数据目录。此路径应在所有集群中唯一，且以相对于 data_dir 目录的相对路径给出。默认值为 data_dir 的值。

nodes 选项是集群所有节点的地址和端口对列表，以逗号分隔。该列表应通过节点的 API 接口获取，可以包含当前节点地址。用于加入集群以及重启后重新加入。

options 选项允许直接传递额外参数给 Galera 复制插件，详情请参见 Galera 文档参数。

在使用复制集群时，所有修改集群表内容的写语句，如 INSERT、REPLACE、DELETE、TRUNCATE、UPDATE，必须使用 cluster_name:table_name 表达式替代表名。这样可以确保变更传播到集群中的所有副本。如果不使用正确表达式，将触发错误。

在JSON接口中，所有写入集群表的语句都必须设置cluster属性以及table名称。如果没有设置cluster属性，将会导致错误。

集群中表的Auto ID 只要server_id正确配置，就是有效的。

‹›

SQL
JSON
PHP
Python
Python-asyncio
Javascript
Java
C#
Rust

📋

INSERT INTO posts:weekly_index VALUES ( 'iphone case' )
TRUNCATE RTINDEX click_query:weekly_index
UPDATE INTO posts:rt_tags SET tags=(101, 302, 304) WHERE MATCH ('use') AND id IN (1,101,201)
DELETE FROM clicks:rt WHERE MATCH ('dumy') AND gid>206

POST /insert -d '
{
  "cluster":"posts",
  "table":"weekly_index",
  "doc":
  {
    "title" : "iphone case",
    "price" : 19.85
  }
}'
POST /delete -d '
{
  "cluster":"posts",
  "table": "weekly_index",
  "id":1
}'

$index->addDocuments([
        1, ['title' => 'iphone case', 'price' => 19.85]
]);
$index->deleteDocument(1);

indexApi.insert({"cluster":"posts","table":"weekly_index","doc":{"title":"iphone case","price":19.85}})
indexApi.delete({"cluster":"posts","table":"weekly_index","id":1})

await indexApi.insert({"cluster":"posts","table":"weekly_index","doc":{"title":"iphone case","price":19.85}})
await indexApi.delete({"cluster":"posts","table":"weekly_index","id":1})

res = await indexApi.insert({"cluster":"posts","table":"weekly_index","doc":{"title":"iphone case","price":19.85}});
 res = await indexApi.delete({"cluster":"posts","table":"weekly_index","id":1});

InsertDocumentRequest newdoc = new InsertDocumentRequest();
HashMap<String,Object> doc = new HashMap<String,Object>(){{
    put("title","Crossbody Bag with Tassel");
    put("price",19.85);
}};
newdoc.index("weekly_index").cluster("posts").id(1L).setDoc(doc);
sqlresult = indexApi.insert(newdoc);
DeleteDocumentRequest deleteRequest = new DeleteDocumentRequest();
deleteRequest.index("weekly_index").cluster("posts").setId(1L);
indexApi.delete(deleteRequest);

Dictionary<string, Object> doc = new Dictionary<string, Object>();
doc.Add("title", "Crossbody Bag with Tassel");
doc.Add("price", 19.85);
InsertDocumentRequest newdoc = new InsertDocumentRequest(table: "weekly_index", cluster:posts, id: 1, doc: doc);
var sqlresult = indexApi.Insert(newdoc);
DeleteDocumentRequest deleteDocumentRequest = new DeleteDocumentRequest(table: "weekly_index", cluster: "posts", id: 1);
indexApi.Delete(deleteDocumentRequest);

let mut doc = HashMap::new();
doc.insert("title".to_string(), serde_json::json!("Crossbody Bag with Tassel"));
doc.insert("price".to_string(), serde_json::json!(19.85));
let insert_req = InsertDocumentRequest {
    table: serde_json::json!("weekly_index"),
    doc: serde_json::json!(doc),
    cluster: serde_json::json!("posts"),
    id: serde_json::json!(1),
};
let insert_res = index_api.insert(insert_req).await;
let delete_req = DeleteDocumentRequest {
    table: serde_json::json!("weekly_index"),
    cluster: serde_json::json!("posts"),
    id: serde_json::json!(1),
};
index_api.delete(delete_req).await;

读取语句如SELECT、CALL PQ、DESCRIBE可以使用不带集群名称的常规表名，或者使用cluster_name:table_name格式。如果使用后者，cluster_name部分会被忽略。

如果使用HTTP端点json/search，可以指定cluster属性，也可以省略。

‹›

SQL
JSON

📋

SELECT * FROM weekly_index
CALL PQ('posts:weekly_index', 'document is here')

可以使用SET语句调整复制插件选项。

可以在Galera 文档参数中找到可用选项的列表。

‹›

SQL
JSON

📋

SET CLUSTER click_query GLOBAL 'pc.bootstrap' = 1

复制节点可能会彼此分离，导致所有节点都被标记为non-primary状态。这可能是由于节点之间的网络分裂、集群崩溃或复制插件在确定primary component时发生异常。在这种情况下，需要选择一个节点并将其提升为primary component角色。

要确定需要提升的节点，应该比较所有节点上的last_committed集群状态变量值。如果所有服务器当前都在运行，无需重启集群。相反，可以使用SET语句将具有最高last_committed值的节点提升为primary component（如示例所示）。

其他节点将重新连接到主节点并根据该节点重新同步其数据。

‹›

SQL
JSON

📋

SET CLUSTER posts GLOBAL 'pc.bootstrap' = 1

要使用复制，需要在配置文件中为SphinxAPI协议定义一个listen端口，并为复制地址和端口范围定义一个listen。还需要指定数据目录以接收传入的表。

‹›

ini

📋

searchd {
  listen   = 9312
  listen   = 192.168.1.101:9360-9370:replication
  data_dir = /var/lib/manticore/
  ...
 }

要复制表，必须在具有要复制的本地表的服务器上创建一个集群。

‹›

SQL
JSON
PHP
Python
Python-asyncio
Javascript
Java
C#
Rust

📋

CREATE CLUSTER posts

POST /cli -d "
CREATE CLUSTER posts
"

$params = [
    'cluster' => 'posts'
    ]
];
$response = $client->cluster()->create($params);

utilsApi.sql('CREATE CLUSTER posts')

await utilsApi.sql('CREATE CLUSTER posts')

res = await utilsApi.sql('CREATE CLUSTER posts');

utilsApi.sql("CREATE CLUSTER posts");

utilsApi.Sql("CREATE CLUSTER posts");

utils_api.sql("CREATE CLUSTER posts", Some(true)).await;

将这些本地表添加到集群中

‹›

SQL
JSON
PHP
Python
Python-asyncio
Javascript
Java
C#
Rust

📋

ALTER CLUSTER posts ADD pq_title
ALTER CLUSTER posts ADD pq_clicks

POST /cli -d "
ALTER CLUSTER posts ADD pq_title
"
POST /cli -d "
ALTER CLUSTER posts ADD pq_clicks
"

$params = [
  'cluster' => 'posts',
  'body' => [
     'operation' => 'add',
     'table' => 'pq_title'
  ]
];
$response = $client->cluster()->alter($params);
$params = [
  'cluster' => 'posts',
  'body' => [
     'operation' => 'add',
     'table' => 'pq_clicks'
  ]
];
$response = $client->cluster()->alter($params);

utilsApi.sql('ALTER CLUSTER posts ADD pq_title')
utilsApi.sql('ALTER CLUSTER posts ADD pq_clicks')

await utilsApi.sql('ALTER CLUSTER posts ADD pq_title')
await utilsApi.sql('ALTER CLUSTER posts ADD pq_clicks')

res = await utilsApi.sql('ALTER CLUSTER posts ADD pq_title');
res = await utilsApi.sql('ALTER CLUSTER posts ADD pq_clicks');

utilsApi.sql("ALTER CLUSTER posts ADD pq_title");
utilsApi.sql("ALTER CLUSTER posts ADD pq_clicks");

utilsApi.Sql("ALTER CLUSTER posts ADD pq_title");
utilsApi.Sql("ALTER CLUSTER posts ADD pq_clicks");

utils_api.sql("ALTER CLUSTER posts ADD pq_title", Some(true)).await;
utils_api.sql("ALTER CLUSTER posts ADD pq_clicks", Some(true)).await;

所有希望接收集群表副本的其他节点应按照以下方式加入集群：

‹›

SQL
JSON
PHP
Python
Python-asyncio
Javascript
Java
C#
Rust

📋

JOIN CLUSTER posts AT '192.168.1.101:9312'

POST /cli -d "
JOIN CLUSTER posts AT '192.168.1.101:9312'
"

$params = [
  'cluster' => 'posts',
  'body' => [
      '192.168.1.101:9312'
  ]
];
$response = $client->cluster->join($params);

utilsApi.sql('JOIN CLUSTER posts AT \'192.168.1.101:9312\'')

await utilsApi.sql('JOIN CLUSTER posts AT \'192.168.1.101:9312\'')

res = await utilsApi.sql('JOIN CLUSTER posts AT \'192.168.1.101:9312\'');

utilsApi.sql("JOIN CLUSTER posts AT '192.168.1.101:9312'");

utilsApi.Sql("JOIN CLUSTER posts AT '192.168.1.101:9312'");

utils_api.sql("JOIN CLUSTER posts AT '192.168.1.101:9312'", Some(true)).await;

运行查询时，将表名前缀为集群名称posts：或在HTTP请求对象中使用cluster属性。

‹›

SQL
JSON
PHP
Python
Python-asyncio
Javascript
Java
C#
Rust

📋

INSERT INTO posts:pq_title VALUES ( 3, 'test me' )

POST /insert -d '
{
  "cluster":"posts",
  "table":"pq_title",
  "id": 3
  "doc":
  {
    "title" : "test me"
  }
}'

$index->addDocuments([
        3, ['title' => 'test me']
]);

indexApi.insert({"cluster":"posts","table":"pq_title","id":3"doc":{"title":"test me"}})

await indexApi.insert({"cluster":"posts","table":"pq_title","id":3"doc":{"title":"test me"}})

res = await indexApi.insert({"cluster":"posts","table":"pq_title","id":3"doc":{"title":"test me"}});

InsertDocumentRequest newdoc = new InsertDocumentRequest();
HashMap<String,Object> doc = new HashMap<String,Object>(){{
    put("title","test me");
}};
newdoc.index("pq_title").cluster("posts").id(3L).setDoc(doc);
sqlresult = indexApi.insert(newdoc);

Dictionary<string, Object> doc = new Dictionary<string, Object>();
doc.Add("title", "test me");
InsertDocumentRequest newdoc = new InsertDocumentRequest(index: "pq_title", cluster: "posts", id: 3, doc: doc);
var sqlresult = indexApi.Insert(newdoc);

let mut doc = HashMap::new();
doc.insert("title".to_string(), serde_json::json!("test me"));
let insert_req = InsertDocumentRequest {
    table: serde_json::json!("pq_title"),
    doc: serde_json::json!(doc),
    cluster: serde_json::json!("posts"),
    id: serde_json::json!(3),
};
let insert_res = index_api.insert(insert_req).await;

集群中所有修改表的查询现在都会复制到集群中的所有节点。

载均衡建复制集群

Last modified: August 28, 2025

要创建一个复制集群，您至少必须为其设置名称。

如果您正在创建单个集群或第一个集群，则可以省略path选项。在这种情况下，将使用data_dir选项作为集群路径。但是，对于所有后续的集群，您必须指定path，并且该路径必须可用。还可以设置nodes选项以列出集群中的所有节点。

‹›

SQL
JSON
PHP
Python
Python-asyncio
javascript
Java
C#
Rust

📋

CREATE CLUSTER posts
CREATE CLUSTER click_query '/var/data/click_query/' as path
CREATE CLUSTER click_query '/var/data/click_query/' as path, 'clicks_mirror1:9312,clicks_mirror2:9312,clicks_mirror3:9312' as nodes

POST /cli -d "
CREATE CLUSTER posts
"
POST /cli -d "
CREATE CLUSTER click_query '/var/data/click_query/' as path
"
POST /cli -d "
CREATE CLUSTER click_query '/var/data/click_query/' as path, 'clicks_mirror1:9312,clicks_mirror2:9312,clicks_mirror3:9312' as nodes
"

$params = [
    'cluster' => 'posts',
    ]
];
$response = $client->cluster()->create($params);
$params = [
    'cluster' => 'click_query',
    'body' => [
        'path' => '/var/data/click_query/'
    ]
    ]
];
$response = $client->cluster()->create($params);
$params = [
    'cluster' => 'click_query',
    'body' => [
        'path' => '/var/data/click_query/',
        'nodes' => 'clicks_mirror1:9312,clicks_mirror2:9312,clicks_mirror3:9312'
    ]
    ]
];
$response = $client->cluster()->create($params);

utilsApi.sql('CREATE CLUSTER posts')
utilsApi.sql('CREATE CLUSTER click_query \'/var/data/click_query/\' as path')
utilsApi.sql('CREATE CLUSTER click_query \'/var/data/click_query/\' as path, \'clicks_mirror1:9312,clicks_mirror2:9312,clicks_mirror3:9312\' as nodes')

await utilsApi.sql('CREATE CLUSTER posts')
await utilsApi.sql('CREATE CLUSTER click_query \'/var/data/click_query/\' as path')
await utilsApi.sql('CREATE CLUSTER click_query \'/var/data/click_query/\' as path, \'clicks_mirror1:9312,clicks_mirror2:9312,clicks_mirror3:9312\' as nodes')

res = await utilsApi.sql('CREATE CLUSTER posts');
res = await utilsApi.sql('CREATE CLUSTER click_query \'/var/data/click_query/\' as path');
res = await utilsApi.sql('CREATE CLUSTER click_query \'/var/data/click_query/\' as path, \'clicks_mirror1:9312,clicks_mirror2:9312,clicks_mirror3:9312\' as nodes');

utilsApi.sql("CREATE CLUSTER posts");
utilsApi.sql("CREATE CLUSTER click_query '/var/data/click_query/' as path");
utilsApi.sql("CREATE CLUSTER click_query '/var/data/click_query/' as path, 'clicks_mirror1:9312,clicks_mirror2:9312,clicks_mirror3:9312' as nodes");

utilsApi.Sql("CREATE CLUSTER posts");
utilsApi.Sql("CREATE CLUSTER click_query '/var/data/click_query/' as path");
utilsApi.Sql("CREATE CLUSTER click_query '/var/data/click_query/' as path, 'clicks_mirror1:9312,clicks_mirror2:9312,clicks_mirror3:9312' as nodes");

utils_api.sql("CREATE CLUSTER posts", Some(true)).await;
utils_api.sql("CREATE CLUSTER click_query '/var/data/click_query/' as path", Some(true)).await;
utils_api.sql("CREATE CLUSTER click_query '/var/data/click_query/' as path, 'clicks_mirror1:9312,clicks_mirror2:9312,clicks_mirror3:9312' as nodes", Some(true)).await;

如果在创建集群时未指定nodes选项，则加入集群的第一个节点将被保存为nodes选项。

设置复制入复制集群

Last modified: August 28, 2025

镜像

代理镜像

负载均衡

ha_strategy

简单随机均衡

自适应随机均衡

nodeads

noerrors

轮询均衡

实例级选项

ha_period_karma

ha_ping_interval

设置复制

复制集群

name

path

nodes

options

写语句

读取语句

集群参数

分离节点的集群

复制和集群

创建复制集群