日志 > 二进制日志 | Manticore Search Manual

查询日志可以通过在配置文件的searchd部分设置query_log指令来启用。

查询也可以通过设置syslog而不是文件路径发送到syslog。在这种情况下，所有搜索查询将使用LOG_INFO优先级发送到syslog守护进程，前面带有[query]而不是时间戳。仅支持syslog的日志格式为plain。

‹›

Config

Config

📋

searchd {
...
    query_log = /var/log/query.log
    query_log_format = sphinxql # default
...
}

支持两种查询日志格式：

sphinxql（默认）：以SQL格式记录。这也提供了一种方便的方式来重放记录的查询。
plain：以简单文本格式记录全文查询。如果大多数查询主要是全文查询，或者不需要记录非全文部分，如属性过滤、排序或分组，那么推荐使用此格式。以plain格式记录的查询无法重放。注意，通过Buddy处理的查询在这种模式下不会被记录。

要切换格式，可以使用searchd设置query_log_format。

SQL日志格式是默认设置。在这种模式下，Manticore记录所有成功的和不成功的select查询。以SQL或二进制API发送的请求以SQL格式记录，但JSON查询按原样记录。这种类型的记录仅适用于纯文本日志文件，并不支持syslog服务进行记录。

‹›

Config

Config

📋

query_log_format = sphinxql # default

与plain格式相比，Manticore SQL日志格式的特性包括：

尽可能记录完整的语句数据。
记录错误和警告。
查询日志可以重放。
记录额外的性能计数器（当前为每个代理分布式查询时间）。
每条日志条目都是一个有效的Manticore SQL/JSON语句，可以重建完整的请求，除非记录的请求太大，需要为了性能原因进行缩短。
JSON请求作为注释记录，跳过元素之间的多余空格。
记录额外的消息、计数器等作为注释。

‹›

Example

Example

📋

/* Sun Apr 28 12:38:02.808 2024 conn 2 (127.0.0.1:53228) real 0.000 wall 0.000 found 0 */ SELECT * FROM test WHERE MATCH('test') OPTION ranker=proximity;
/* Sun Apr 28 12:38:05.585 2024 conn 2 (127.0.0.1:53228) real 0.001 wall 0.001 found 0 */ SELECT * FROM test WHERE MATCH('test') GROUP BY channel_id OPTION ranker=proximity;
/* Sun Apr 28 12:40:57.366 2024 conn 4 (127.0.0.1:53256) real 0.000 wall 0.000 found 0 */  /*{ "index" : "test", "query": { "match": { "*" : "test" } }, "_source": ["f"], "limit": 30 } */

需要注意的是，Manticore 不仅记录 SELECT 查询，还记录诸如 UPDATE 之类的数据修改语句。UPDATE 语句会以 SQL 日志格式记录，而 INSERT、REPLACE 和 DELETE 操作不会被记录。如果你需要对所有操作进行完整日志记录，可能还需要在应用层额外实现日志。

‹›

Example

Example

📋

/* Sat Mar 15 01:05:28.508 2025 conn 7 (127.0.0.1:63942) real 0.000 */ UPDATE test SET title='Updated Title' WHERE id=1;

使用plain日志格式，Manticore以简单文本格式记录所有成功执行的搜索查询。查询的非全文部分不会被记录。JSON查询记录为单行条目。通过Buddy处理的查询不会被记录。

‹›

Config

Config

📋

query_log_format = plain

日志格式如下：

[query-date] real-time wall-time [match-mode/filters-count/sort-mode total-matches (offset,limit) @groupby-attr] [table-name] {perf-stats} query

其中：

real-time 是从查询开始到结束的端到端时间。在 SphinxQL 日志中，它对应 real 字段。
wall-time 是 Manticore 的内部查询墙时间指标。在 SphinxQL 日志中，它对应 wall 字段，且此值也用于 query_log_min_msec。对于分布式和多源查询，wall-time 可能与 real-time 不同。
perf-stats包括当Manticore以--cpustats（或通过SET GLOBAL cpustats=1启用）和/或--iostats（或通过SET GLOBAL iostats=1启用）启动时的CPU/IO统计信息：
- ios是执行的文件I/O操作数；
- kb是从表文件读取的数据量（以千字节为单位）；
- ms是I/O操作所花费的时间。
- cpums是花费在查询CPU处理上的时间（以毫秒为单位）。
match-mode可以有以下值之一：
- "all"对应SPH_MATCH_ALL模式；
- "any"对应SPH_MATCH_ANY模式；
- "phr"对应SPH_MATCH_PHRASE模式；
- "bool"对应SPH_MATCH_BOOLEAN模式；
- "ext"对应SPH_MATCH_EXTENDED模式；
- "ext2"对应SPH_MATCH_EXTENDED2模式；
- "scan"如果使用了全扫描模式，无论是通过SPH_MATCH_FULLSCAN指定的，还是查询为空。
sort-mode可以有以下值之一：
- "rel"对应SPH_SORT_RELEVANCE模式；
- "attr-"对应SPH_SORT_ATTR_DESC模式；
- "attr+"对应SPH_SORT_ATTR_ASC模式；
- "tsegs"对应SPH_SORT_TIME_SEGMENTS模式；
- "ext"对应SPH_SORT_EXTENDED模式。

注意：SPH*模式是sphinx遗留接口特有的。SQL和JSON接口通常会记录ext2作为match-mode，ext和rel作为sort-mode。

对于分布式查询，请使用 SHOW STATUS 计数器 dist_wall、dist_local 和 dist_wait 来分析时间消耗。这些计数器是互补的，不能直接替代查询日志中的 real/wall。

‹›

Example

Example

📋

[Fri Jun 29 21:17:58 2021] 0.004 sec [all/0/rel 35254 (0,20)] [lj] [ios=6 kb=111.1 ms=0.5] test
[Fri Jun 29 21:17:58 2021] 0.004 sec [all/0/rel 35254 (0,20)] [lj] [ios=6 kb=111.1 ms=0.5 cpums=0.3] test
[Sun Apr 28 15:09:38.712 2024] 0.000 sec 0.000 sec [ext2/0/ext 0 (0,20)] [test] test
[Sun Apr 28 15:09:44.974 2024] 0.000 sec 0.000 sec [ext2/0/ext 0 (0,20) @channel_id] [test] test
[Sun Apr 28 15:24:32.975 2024] 0.000 sec 0.000 sec [ext2/0/ext 0 (0,30)] [test] {     "table" : "test",     "query":     {         "match":         {             "*" : "test"         }     },     "_source": ["f"],     "limit": 30 }

与 SQL 日志格式不同，纯文本日志格式只记录搜索查询（SELECT 语句）。INSERT、REPLACE、DELETE 和 UPDATE 之类的数据修改语句不会以这种格式记录。UPDATE 语句会以 SQL 格式记录，但不会以纯文本格式记录。

默认情况下，所有查询都会被记录。如果您只想记录执行时间超过指定限制的查询，可以使用query_log_min_msec指令。

预期的单位是毫秒，但也可以使用时间后缀表达式。

‹›

Config

Config

📋

searchd {
...
    query_log = /var/log/query.log
    query_log_min_msec  = 1000
    # query_log_min_msec  = 1s
...
}

默认情况下，searchd和查询日志文件的权限为600，因此只有Manticore运行的用户和root才能读取日志文件。query_log_mode选项允许设置不同的权限。这对于允许其他用户读取日志文件（例如，运行在非root用户上的监控解决方案）是有帮助的。

‹›

Config

Config

📋

searchd {
...
    query_log = /var/log/query.log
    query_log_mode = 666
...
}

服务器日志

Last modified: June 26, 2026

默认情况下，Manticore搜索守护进程会在启动搜索守护进程的目录中将所有运行时事件记录在searchd.log文件中。在Linux中，默认情况下，您可以在/var/log/manticore/searchd.log找到日志。

日志文件的路径/名称可以通过在配置文件的searchd部分设置log来覆盖。

searchd {
...
    log = /custom/path/to/searchd.log
...
}

您也可以使用syslog作为文件名。在这种情况下，事件将发送到您的服务器的syslog守护进程。
在某些情况下，您可能希望将/dev/stdout用作文件名。在这种情况下，在Linux中，Manticore将简单地输出事件。这在Docker/Kubernetes环境中非常有用。

查询日志二进制日志

Last modified: August 28, 2025

二进制日志记录作为实时表数据的恢复机制。当启用二进制日志时，searchd 会将每个事务记录到 binlog 文件中，并在非正常关闭后利用其进行恢复。在正常关闭期间，RAM 数据块会保存到磁盘，并随后删除所有的 binlog 文件。

默认情况下，启用二进制日志以保护数据完整性。在 Linux 系统上，纯模式中 binlog.* 文件的默认位置是 /var/lib/manticore/data/。在RT 模式下，二进制日志存储在 <data_dir>/binlog/ 文件夹内，除非另有指定。

要全局禁用二进制日志，请在 searchd 配置中将 binlog_path 设置为空值。
禁用二进制日志需要重启守护进程，并且如果系统意外关闭，可能会导致数据风险。

‹›

Example

Example

📋

searchd {
...
    binlog_path = # disable logging
...

你可以使用以下指令设置自定义路径：

‹›

Example

Example

📋

searchd {
...
    binlog_path = /var/data
...

为了更细粒度的控制，可以通过将 binlog 表参数设置为 0 来禁用实时表的二进制日志。此选项不适用于 percolate 表。

‹›

Example

Example

📋

create table a (id bigint, s string attribute) binlog='0';

对于已存在的 RT 表，也可以通过修改 binlog 参数来禁用二进制日志。

‹›

Example

Example

📋

alter table FOO binlog='0';

如果之前禁用了二进制日志，可以通过将 binlog 参数重新设置为 1 来启用：

‹›

Example

Example

📋

alter table FOO binlog='1';

依赖全局设置：每个表的二进制日志配置只有在 searchd 配置中全局启用了二进制日志（binlog_path 非空）时才生效。
二进制日志状态和事务 ID 说明：修改表的二进制日志状态会强制立即刷新表。如果关闭某个表的二进制日志，其事务 ID（TID）将变为 -1，表示未启用二进制日志且不跟踪更改。反之，如果开始启用二进制日志，事务 ID 会变为非负数（零或更大），表示表的变更正在被记录。你可以使用命令 SHOW TABLE <name> STATUS 来查看事务 ID。事务 ID 显示表的变动是否被记录（非负数）或未被记录（-1）。

当启用二进制日志时，对 RT 表的每次更改都会保存到日志文件中。如果系统意外关闭，系统重启时会自动利用这些日志恢复所有已记录的更改。

在正常运行时，当已记录数据大小达到由 binlog_max_log_size 设置的限制时，会创建一个新的日志文件。旧日志文件会保留，直到其中的所有更改被完全处理并保存为磁盘块。如果该限制设置为 0，日志文件会一直保留到系统正确关闭为止。默认情况下，没有限制日志文件大小。

‹›

Example

Example

📋

searchd {
...
    binlog_max_log_size = 16M
....

每个 binlog 文件的命名格式为带零填充的数字，如 binlog.0000、binlog.0001 等，通常显示四位数字。你可以通过设置 binlog_filename_digits 来更改数字位数。如果 binlog 文件数量超过位数限制，位数会自动增加以适应所有文件。

重要：要更改数字位数，必须先保存所有表数据并正确关闭系统，然后删除旧的日志文件，再重启系统。

‹›

Example

Example

📋

searchd {
...
    binlog_filename_digits = 6
...

你可以通过 binlog_common 指令选择两种二进制日志文件管理方式：

每表单独文件（默认，0）：每个表将其更改保存在自己的日志文件中。该设置适合存在多个不同时间更新的表。它允许表独立更新而不等待其他表。此外，一个表的日志文件出现问题不会影响其他表。
所有表共用单一文件（1）：所有表使用同一个二进制日志文件。该方式更易于管理文件，因为文件较少。然而，如果有表仍需保存更新，文件可能会被保留时间过长。如果多个表同时需要更新，可能会因等待写入同一文件而降低性能。

‹›

binlog_common

binlog_common

📋

searchd {
...
    binlog_common = 1
...

二进制日志刷新有四种策略，由 binlog_flush 指令控制：

0 - 数据每秒写入磁盘（刷新），随后 Manticore 会立即启动将其安全保存在磁盘上（同步）。此方法最快，但如果服务器或计算机突然崩溃，可能会丢失一些尚未安全保存的最近写入数据。
1 - 数据在每次事务后写入 binlog 并立即同步。此方法最安全，因为它确保每次更改都被立即保存，但会降低写入速度。
2 - 数据在每次事务后写入，并且每秒启动一次同步。此方法在定期快速写入数据与安全性之间取得平衡。但如果计算机失败，某些正在保存的数据可能未完成保存。此外，根据磁盘情况，同步可能需要超过一秒钟的时间。
3 - 类似于 2，但还确保 binlog 文件在因超过 binlog_max_log_size 而关闭之前同步。

默认模式为 2，即每次事务后写入数据，并每秒启动同步，平衡速度和安全性。

‹›

Example

Example

📋

searchd {
...
    binlog_flush = 1 # ultimate safety, low write speed
...
}

在使用 Galera 的集群设置中，节点恢复行为至关重要。通常，如果节点正常关闭且其最后的序列号 (seqno) 被正确保存，Galera 会通过 IST（增量状态传输）处理节点不同步的情况。然而，如果发生崩溃导致 seqno 未被保存，Galera 会触发 SST（状态快照传输），这是一种资源密集型操作，会因高 I/O 活动显著减缓集群速度。

为了解决这一问题，引入了集群 binlog 支持。该功能扩展了现有的二进制日志功能，帮助减少 SST 的需求，使恢复节点能够从本地 binlog 重放缺失的事务，并带着有效的 seqno 重新加入集群。

集群 binlog 默认在任何集群操作中启用，但可以通过设置环境变量关闭：

‹›

binlog_cluster

binlog_cluster

📋

MANTICORE_REPLICATION_BINLOG=0

该功能通过结合二进制日志的本地持久性与 Galera 的分布式同步能力，减少了停机时间并避免了完整数据传输。

在非正常关闭后的恢复过程中，会重放 binlog，恢复自上一次良好磁盘状态以来所有记录的事务。事务有校验和，因此如果 binlog 文件损坏，垃圾数据不会被重放；损坏的事务将被检测到并停止重放。

频繁更新完全适合于 RAM 块的小型 RT 表会导致 binlog 不断增长，且除非干净关闭，否则无法解除链接。binlog 实质上是针对磁盘上最后已知良好保存状态的追加型增量，除非保存了 RAM 块，否则无法解除链接。持续增长的 binlog 对磁盘使用和崩溃恢复时间不理想。为了解决此问题，可以通过配置 searchd 使用 rt_flush_period 指令执行周期性 RAM 块刷新。启用周期刷新后，searchd 会维护一个单独线程，检查 RT 表的 RAM 块是否需要写回磁盘。一旦发生，相关的 binlog 就可以（并且会被）安全解除链接。

默认的 RT 刷新周期设置为 10 小时。

‹›

Example

Example

📋

searchd {
...
    rt_flush_period = 3600 # 1 hour
...
}

重要的是，rt_flush_period 仅控制检查频率。不保证某个具体的 RAM 块一定会被保存。例如，定期重存仅有少量行更新的大 RAM 块没有意义。Manticore 使用一些启发式方法自动确定是否执行刷新。

服务器日志 Docker 日志

Last modified: August 28, 2025

当你使用官方 Manticore Docker 镜像时，服务器日志会发送到 /dev/stdout，可在宿主机上通过以下方式查看：

docker logs manticore

可以通过传入变量 QUERY_LOG_TO_STDOUT=true 将查询日志重定向到 Docker 日志。

日志目录与 Linux 软件包的情况相同，设置为 /var/log/manticore。如有需要，可以将其挂载到本地路径，以便查看或处理日志。

二进制日志旋转查询和服务器日志

Last modified: August 28, 2025

查询日志

日志格式

SQL日志格式

Plain日志格式

仅记录慢查询

日志文件权限模式

服务器日志记录

二进制日志记录

启用和禁用二进制日志

全局二进制日志配置

按表二进制日志配置

重要注意事项：

操作

日志大小

日志文件

二进制日志策略

二进制刷新策略

集群 binlog 支持

恢复

刷新 RT RAM 块

Docker 日志