MySQL ProxySQL 配置：connection / query / route / response 四段 lifecycle 跟 query rule 設計

2026-05-19

本文是 MySQL overview 的 implementation-layer deep article。Overview 已說明 MySQL 在 OLTP 譜系的定位、本文聚焦 ProxySQL 配置 — connection pool + query routing 的 4 段 lifecycle 跟 rule chain 設計。

ProxySQL Lifecycle：每個 query 走 4 段

從 application 連 ProxySQL 到拿到 response、每個 query 都走完整 4 段：

11. Connection 接入        →  application connect 到 ProxySQL（不是 MySQL）
22. Query parse + rule match  → ProxySQL 解析 query、match query rule chain
33. Backend route          →  決定走哪個 hostgroup（primary / replica）+ 哪個 server
44. Response 返回          →  將 result set 回 application、connection 可被 reuse

每段都有獨立配置 + failure mode + 觀測 metric。ProxySQL 不是 簡單的 connection pool、是 query-aware proxy — 看得到 SQL 內容才能做 read/write split、replica lag-aware routing、query mirroring。

跟 PostgreSQL pgBouncer 比、pgBouncer 是 transaction-level pool（只看連線、不看 SQL）、ProxySQL 是 query-level proxy（看 SQL、做 routing decision）。能力不同、target use case 不同。

Stage 1：Connection 接入 — Hostgroup / Server / User 三層 schema

ProxySQL 不直接 expose backend MySQL、用 hostgroup 作為 routing 抽象。Application 不知道有幾個 backend、只知道 ProxySQL。

核心 table（在 main database）：

Table	角色
`mysql_servers`	列每個 backend MySQL server、屬於哪個 hostgroup
`mysql_replication_hostgroups`	定義 writer hostgroup ↔ reader hostgroup 配對、自動偵測 primary 切換
`mysql_users`	列允許連 ProxySQL 的 application user、預設 hostgroup
`mysql_query_rules`	Query rule chain、決定哪個 query 走哪個 hostgroup

典型部署：

 1-- 進 ProxySQL admin (6032 port)
 2mysql -uadmin -padmin -h127.0.0.1 -P6032
 3
 4-- 設 2 個 hostgroup：10=writer、20=reader
 5INSERT INTO mysql_servers(hostgroup_id, hostname, port, weight, max_connections)
 6VALUES
 7  (10, 'primary.example.com', 3306, 1000, 200),
 8  (20, 'replica1.example.com', 3306, 1000, 100),
 9  (20, 'replica2.example.com', 3306, 1000, 100);
10
11-- 自動偵測 primary（用 read_only flag）
12INSERT INTO mysql_replication_hostgroups(writer_hostgroup, reader_hostgroup, comment)
13VALUES (10, 20, 'production cluster');
14
15-- 設 application user、預設走 reader（保守）
16INSERT INTO mysql_users(username, password, default_hostgroup, max_connections)
17VALUES ('app', 'app_password', 20, 1000);
18
19-- 套用設定到 runtime
20LOAD MYSQL SERVERS TO RUNTIME;
21LOAD MYSQL USERS TO RUNTIME;
22
23-- 持久化到 disk（重啟保留）
24SAVE MYSQL SERVERS TO DISK;
25SAVE MYSQL USERS TO DISK;

注意 ProxySQL 的 三層 state：disk（持久化）→ memory（編輯區）→ runtime（實際運作）。每次改完要 LOAD ... TO RUNTIME 才生效、SAVE ... TO DISK 才能 reboot 保留。沒 SAVE 重啟後 config 消失是新手最常踩的雷。

Stage 2：Query Parse + Rule Match — query rule engine

ProxySQL 不只 forward connection、看 SQL 內容 決定怎麼 route。Query rule 是 ordered chain、match 第一個符合的 rule。

Query rule 核心欄位：

欄位	意義
`rule_id`	排序（越小越先 match）
`match_pattern`	regex 比對 SQL（支援 `^SELECT` / `FOR UPDATE` 等）
`destination_hostgroup`	match 後送哪個 hostgroup
`apply`	match 後是否停 chain（1=stop、0=繼續看後面 rule）
`cache_ttl`	result cache TTL（毫秒）— ProxySQL 內建 query cache
`mirror_hostgroup`	query 鏡像送到第二個 hostgroup（不等 response、用於 shadow test）

典型讀寫分離 rule：

 1-- Rule 100: SELECT ... FOR UPDATE 必須走 primary
 2INSERT INTO mysql_query_rules(rule_id, active, match_pattern, destination_hostgroup, apply)
 3VALUES (100, 1, '^SELECT.*FOR UPDATE$', 10, 1);
 4
 5-- Rule 200: 一般 SELECT 走 replica（reader）
 6INSERT INTO mysql_query_rules(rule_id, active, match_pattern, destination_hostgroup, apply)
 7VALUES (200, 1, '^SELECT', 20, 1);
 8
 9-- Rule 300: BEGIN / START TRANSACTION 走 primary
10INSERT INTO mysql_query_rules(rule_id, active, match_pattern, destination_hostgroup, apply)
11VALUES (300, 1, '^(BEGIN|START TRANSACTION)', 10, 1);
12
13-- 其他（INSERT / UPDATE / DELETE）預設走 default_hostgroup（user 設的）
14-- application user default 設 10 (writer)、所以寫入自動走 primary
15
16LOAD MYSQL QUERY RULES TO RUNTIME;
17SAVE MYSQL QUERY RULES TO DISK;

Rule 順序很重要：rule_id 100 先 match、200 再 match、依此類推。Rule 200 比 100 寬鬆（任何 SELECT）、所以 FOR UPDATE 必須先 match rule 100 才不會誤送 replica。

Stage 3：Backend Route — replica lag-aware + circuit breaker

Rule match 後 ProxySQL 從 hostgroup 內挑一個 server。Backend selection 不是 pure round-robin、考慮：

Weight：每個 server weight 比例分配（典型用於 replica capacity 不同）
Replica lag：若 hostgroup 設 max_replication_lag、lag 超過 threshold 的 replica 自動暫時退出
Connection count：避免某個 server connection 滿
Server status：mysql_servers.status (ONLINE / SHUNNED / OFFLINE_SOFT / OFFLINE_HARD) 決定是否可用

Replica lag-aware routing 配置：

1-- 給整個 reader hostgroup 設 lag threshold
2UPDATE mysql_servers
3SET max_replication_lag = 5  -- 秒
4WHERE hostgroup_id = 20;
5
6LOAD MYSQL SERVERS TO RUNTIME;

ProxySQL 內部用 monitor module 定期跑 SHOW SLAVE STATUS、lag 超過 5 秒 → 該 replica 暫時退出 reader hostgroup。讀 query 自動避開 lagging replica。

Circuit breaker（自動 shun）：server 連續失敗 → ProxySQL 自動 SHUNNED、避免持續打 broken server。但 application 層仍要處理 retry、ProxySQL 不保證 query 100% 成功。

Stage 4：Response 返回 — connection multiplexing

ProxySQL 對 application connection 跟 backend connection 是 N:M 多工：

Application connection 跟 ProxySQL 1:1
ProxySQL 跟 backend MySQL connection 共用 pool（multiplexing）

Multiplexing 條件：

Transaction 內：connection 綁定特定 backend（保 transaction atomicity）
跨 transaction：connection 可以換 backend
SET statement 改 session variable：connection 黏死 backend（防 session state leak）
User variable（@var）：connection 黏死 backend

結果：application 看到的是「自己有 1000 個 connection」、ProxySQL 後端可能只有 100 connection 到 MySQL。對 connection-bound MySQL（max_connections 限制）是關鍵 cost saving。

5 個 Production 踩雷

1. Query rule 順序錯亂 — `FOR UPDATE` 被 SELECT route 到 replica

Rule 200（^SELECT）寫在 rule 100（^SELECT.*FOR UPDATE$）之前、ProxySQL match 第一個 rule（rule 200）就停、SELECT ... FOR UPDATE 被送 replica、replica 沒 lock、application 假設有 lock 跑 race condition。

修法：

rule_id 排序：精確 rule（多條件 regex）放小、寬鬆 rule 放大
用 apply=1 強制停 chain、不要讓 query 繼續往下 match
跑 ProxySQL SHOW PROCESSLIST + audit log 確認 routing 正確

2. Connection 漂移 — Multiplexing 把 session variable 弄丟

Application 跑 SET sql_mode=...、ProxySQL 把這 connection 暫時黏死 backend 1。下個 query ProxySQL forget、把 connection unstick、實際 forward 到 backend 2（沒 SET sql_mode）、SQL 解析行為不同、application bug。

修法：

用 mysql-multiplexing=false 全 disable（最簡單但浪費 connection pool 效率）
或在 application init 連線後跑的 SET 全列在 mysql_users.connect_init（每個 connection ProxySQL 自動跑、不會漂移）
避免 application 中途改 session variable、改成全部走 ProxySQL connect_init

3. Write 不小心 route 到 replica — `default_hostgroup` 設錯

Application user default_hostgroup 設 20 (reader)、INSERT / UPDATE / DELETE 沒 match 到任何 rule（沒寫 catch-all write rule）、走 default → 送 replica → replica 是 read-only → error。或更糟：replica 不是 read-only mode、寫入 寫到 replica 上、replication 反向不同步、data corruption。

修法：

Application user default_hostgroup 設 10 (writer) — 寫入預設走 primary
Replica MySQL 一定要 read_only=1（防 stale write 寫到 replica）
監控 mysql_query_rules match 率、寫入 query 應該大部分透過 default_hostgroup 路由、不是個別 rule

4. Runtime / disk schema drift — 改了 runtime 沒 save、重啟 config 消失

LOAD ... TO RUNTIME 跟 SAVE ... TO DISK 是兩個獨立操作。On-call 在事故中改 ProxySQL 配置（add server、調 query rule）、LOAD 套到 runtime 但忘記 SAVE、隔天 ProxySQL 重啟（OS update / crash）、config 回到 disk 版本、半夜 alert。

修法：

每次 LOAD ... TO RUNTIME 後立刻 SAVE ... TO DISK（變成 habit）
用 IaC（Terraform / Ansible）管 ProxySQL config、不要手動改 admin
監控：對比 runtime_mysql_servers 跟 mysql_servers（disk）、有 diff 即告警

5. Mirror traffic 副作用 — INSERT 鏡像到 staging 寫了兩次

mirror_hostgroup 把 query 鏡像送到第二個 hostgroup（不等 response、用於 shadow test 新 schema）。但 鏡像是真實執行、不是 dry-run。鏡像 INSERT 到 staging hostgroup → staging 真的多了 row。如果 staging hostgroup 接到 production 表（誤接）、production 寫入 doubled。

修法：

Mirror 只用於 獨立 staging cluster、不混用 production schema
Mirror 設定要 review（規則 match_pattern 跟 mirror_hostgroup 配對）
開 mirror 前在 staging 跑 dry-run、確認 schema 跟 production isolated

容量規劃要點

對 100 application instance × 50 connection / instance = 5000 application connection 場景：

配置	ProxySQL 設定	MySQL backend 配置
Application → ProxySQL	`mysql-max_connections=10000`	不影響
ProxySQL → MySQL primary	`max_connections=200`（per server）	MySQL `max_connections=300`（多 100 buffer for admin）
ProxySQL → MySQL replica	`max_connections=200`（per server）	同上
ProxySQL 數量（HA）	至少 2 instance（HAProxy / VIP）	-
Memory per ProxySQL	2-4 GB（query rule cache + connection pool）	-

ProxySQL 本身需要 HA：放兩個 instance 後面接 VIP（keepalived）或 HAProxy。Application 連 VIP / HAProxy、不直接連 ProxySQL hostname（單點失效）。

跟其他模組整合

跟 Replication topology

ProxySQL 透過 monitor module 自動偵測 primary（檢查 read_only flag）+ replica lag（檢查 Seconds_Behind_Master）。這個 monitor 依賴 MySQL replication 已配好（GTID + binlog ROW format）。詳見 Replication Topology。

跟 Orchestrator HA

Orchestrator 自動 failover 後新 primary 的 read_only flag 變 0、舊 primary 變 1。ProxySQL monitor 偵測到、自動把 hostgroup 10（writer）的 server 切換、application 不必改 connection string。

詳見 Orchestrator failover 設計 篇（待寫）。

跟 OSC tool（gh-ost / pt-osc）

ProxySQL 可以 暫時 throttle application 對某張表的寫入（query rule delay 欄位）、配合 OSC tool cut-over 時段降低 metadata lock 衝突。

詳見 Online Schema Change Tools。

跟 Aurora MySQL / RDS Proxy

Aurora MySQL 推 RDS Proxy（AWS managed proxy）取代 ProxySQL — 跟 IAM 整合、failover < 30 秒。但 RDS Proxy 沒有 query routing rule engine（只做 connection pool）、不能讀寫分離。Aurora user 仍可能用 ProxySQL 在前面、再用 RDS Proxy 作 backend connection pool。

詳見 Aurora vendor page。

跟 PostgreSQL pgBouncer 對比

維度	ProxySQL（MySQL）	pgBouncer（PostgreSQL）
抽象層	Query-level proxy	Transaction-level pool
Query routing	內建（rule engine）	無（不看 SQL）
Connection pool	內建	核心功能
Read/write split	內建（自動 + rule）	要 application 層或 HAProxy 配
Replica lag-aware	內建	無
Query cache	內建	無

ProxySQL 是 query 層中介、pgBouncer 是 connection 層中介。詳見 pgBouncer 配置。

Tarragon

MySQL ProxySQL 配置：connection / query / route / response 四段 lifecycle 跟 query rule 設計

ProxySQL Lifecycle：每個 query 走 4 段

Stage 1：Connection 接入 — Hostgroup / Server / User 三層 schema

Stage 2：Query Parse + Rule Match — query rule engine

Stage 3：Backend Route — replica lag-aware + circuit breaker

Stage 4：Response 返回 — connection multiplexing

5 個 Production 踩雷

1. Query rule 順序錯亂 — `FOR UPDATE` 被 SELECT route 到 replica

2. Connection 漂移 — Multiplexing 把 session variable 弄丟

3. Write 不小心 route 到 replica — `default_hostgroup` 設錯

4. Runtime / disk schema drift — 改了 runtime 沒 save、重啟 config 消失

5. Mirror traffic 副作用 — INSERT 鏡像到 staging 寫了兩次

容量規劃要點

跟其他模組整合

跟 Replication topology

跟 Orchestrator HA

跟 OSC tool（gh-ost / pt-osc）

跟 Aurora MySQL / RDS Proxy

跟 PostgreSQL pgBouncer 對比

相關連結

MySQL ProxySQL 配置：connection / query / route / response 四段 lifecycle 跟 query rule 設計

ProxySQL Lifecycle：每個 query 走 4 段

Stage 1：Connection 接入 — Hostgroup / Server / User 三層 schema

Stage 2：Query Parse + Rule Match — query rule engine

Stage 3：Backend Route — replica lag-aware + circuit breaker

Stage 4：Response 返回 — connection multiplexing

5 個 Production 踩雷

1. Query rule 順序錯亂 — FOR UPDATE 被 SELECT route 到 replica

2. Connection 漂移 — Multiplexing 把 session variable 弄丟

3. Write 不小心 route 到 replica — default_hostgroup 設錯

4. Runtime / disk schema drift — 改了 runtime 沒 save、重啟 config 消失

5. Mirror traffic 副作用 — INSERT 鏡像到 staging 寫了兩次

容量規劃要點

跟其他模組整合

跟 Replication topology

跟 Orchestrator HA

跟 OSC tool（gh-ost / pt-osc）

跟 Aurora MySQL / RDS Proxy

跟 PostgreSQL pgBouncer 對比

相關連結

1. Query rule 順序錯亂 — `FOR UPDATE` 被 SELECT route 到 replica

3. Write 不小心 route 到 replica — `default_hostgroup` 設錯