Skip to content

MySQL 读写分离与连接池配置

读写分离是 MySQL 数据库常用的性能优化手段之一,它通过将读请求分散到多个从库,减轻主库的压力,提高系统的整体吞吐量。连接池则可以减少数据库连接的创建和销毁开销,提高连接利用率。本文将详细介绍 MySQL 读写分离与连接池的配置方法,包括应用层和中间件层的实现方案,兼顾不同 MySQL 版本的差异。

读写分离基础概念

读写分离原理

读写分离的核心思想是将数据库的读操作和写操作分离到不同的数据库节点上:

  1. 写操作:所有写操作(INSERT、UPDATE、DELETE)都发送到主库
  2. 读操作:所有读操作(SELECT)都发送到从库
  3. 数据同步:主库通过复制机制将数据变更同步到从库

读写分离优势

  1. 提高系统吞吐量:分散读请求,减轻主库压力
  2. 提高系统可用性:从库故障不影响写操作,主库故障可以快速切换
  3. 优化资源利用率:根据读写负载调整主从库资源配置
  4. 支持水平扩展:可以通过增加从库数量提高读性能

读写分离挑战

  1. 数据一致性问题:主从复制存在延迟,可能导致从库读取到旧数据
  2. 连接管理复杂:需要管理多个数据库连接
  3. 事务处理复杂:跨主从库的事务处理难度大
  4. SQL 兼容性问题:某些 SQL 语句可能不适合读写分离
  5. 监控和维护复杂:需要监控多个节点的状态

读写分离实现方案

1. 应用层读写分离

应用层读写分离是在应用程序代码中实现读写分离逻辑,直接连接数据库节点。

实现方式

  1. 硬编码方式:在应用代码中直接指定主从库连接
  2. 配置文件方式:在配置文件中配置主从库连接信息,应用程序根据配置选择连接
  3. ORM 框架方式:使用 ORM 框架提供的读写分离功能

主流框架支持

  1. Java 框架

    • Spring JDBC + AbstractRoutingDataSource
    • MyBatis + 读写分离插件
    • Hibernate + 读写分离配置
  2. PHP 框架

    • Laravel + 读写分离配置
    • ThinkPHP + 读写分离配置
  3. Python 框架

    • Django + 读写分离配置
    • SQLAlchemy + 读写分离配置

应用层读写分离示例(Spring Boot)

  1. 配置文件
yaml
spring:
  datasource:
    master:
      url: jdbc:mysql://192.168.1.100:3306/test?useSSL=false&serverTimezone=UTC
      username: root
      password: password
      driver-class-name: com.mysql.cj.jdbc.Driver
    slave:
      url: jdbc:mysql://192.168.1.101:3306/test?useSSL=false&serverTimezone=UTC
      username: root
      password: password
      driver-class-name: com.mysql.cj.jdbc.Driver
    type: com.zaxxer.hikari.HikariDataSource
  1. 实现动态数据源
java
public class DynamicDataSource extends AbstractRoutingDataSource {
    @Override
    protected Object determineCurrentLookupKey() {
        return DataSourceContextHolder.getDataSourceType();
    }
}

public class DataSourceContextHolder {
    private static final ThreadLocal<String> CONTEXT_HOLDER = new ThreadLocal<>();

    public static void setDataSourceType(String dataSourceType) {
        CONTEXT_HOLDER.set(dataSourceType);
    }

    public static String getDataSourceType() {
        return CONTEXT_HOLDER.get();
    }

    public static void clearDataSourceType() {
        CONTEXT_HOLDER.remove();
    }
}
  1. 实现读写分离注解
java
@Target(ElementType.METHOD)
@Retention(RetentionPolicy.RUNTIME)
@Documented
public @interface DataSource {
    String value() default "master";
}

@Aspect
@Component
public class DataSourceAspect {
    @Before("@annotation(com.example.demo.annotation.DataSource)")
    public void beforeSwitchDataSource(JoinPoint point) {
        MethodSignature signature = (MethodSignature) point.getSignature();
        DataSource annotation = signature.getMethod().getAnnotation(DataSource.class);
        DataSourceContextHolder.setDataSourceType(annotation.value());
    }

    @After("@annotation(com.example.demo.annotation.DataSource)")
    public void afterSwitchDataSource(JoinPoint point) {
        DataSourceContextHolder.clearDataSourceType();
    }
}
  1. 使用读写分离注解
java
@Service
public class UserServiceImpl implements UserService {
    @Autowired
    private UserMapper userMapper;

    @DataSource("master")
    @Override
    public void save(User user) {
        userMapper.insert(user);
    }

    @DataSource("slave")
    @Override
    public User getById(Long id) {
        return userMapper.selectById(id);
    }
}

优缺点

优点

  • 实现简单,无需额外组件
  • 性能较好,减少中间层开销
  • 灵活性高,可以根据业务需求定制读写分离逻辑

缺点

  • 应用代码与数据库耦合度高
  • 主从库数量变化需要修改应用代码
  • 跨语言应用需要重复实现读写分离逻辑
  • 事务处理复杂

2. 中间件层读写分离

中间件层读写分离是通过专门的数据库中间件实现读写分离逻辑,应用程序只连接中间件,不直接连接数据库节点。

主流中间件

  1. ProxySQL

    • 开源、高性能的 MySQL 代理
    • 支持读写分离、负载均衡、故障检测和自动切换
    • 支持查询路由和缓存
    • 适合大规模部署
  2. MaxScale

    • MariaDB 公司开发的开源中间件
    • 支持读写分离、负载均衡、故障检测和自动切换
    • 支持各种过滤和路由规则
    • 适合 MariaDB 和 MySQL 环境
  3. MySQL Router

    • MySQL 官方提供的轻量级中间件
    • 支持读写分离和故障切换
    • 与 MySQL 企业版集成良好
    • 适合中小型部署
  4. Atlas

    • 360 公司开源的 MySQL 中间件
    • 基于 MySQL Proxy 开发
    • 支持读写分离、负载均衡和故障切换
    • 适合中小型部署
  5. TDDL

    • 阿里巴巴开源的分布式数据库中间件
    • 支持读写分离、分库分表
    • 适合大规模分布式场景

ProxySQL 读写分离配置

  1. 安装 ProxySQL
bash
# Ubuntu/Debian
sudo apt-get install proxysql

# CentOS/RHEL
sudo yum install proxysql
  1. 配置 ProxySQL
sql
-- 连接 ProxySQL 管理界面
mysql -u admin -padmin -h 127.0.0.1 -P 6032

-- 添加主库
INSERT INTO mysql_servers (hostgroup_id, hostname, port, weight, max_connections) VALUES (10, '192.168.1.100', 3306, 1, 1000);

-- 添加从库
INSERT INTO mysql_servers (hostgroup_id, hostname, port, weight, max_connections) VALUES (20, '192.168.1.101', 3306, 1, 1000);
INSERT INTO mysql_servers (hostgroup_id, hostname, port, weight, max_connections) VALUES (20, '192.168.1.102', 3306, 1, 1000);

-- 添加用户
INSERT INTO mysql_users (username, password, active, default_hostgroup, max_connections) VALUES ('app', 'password', 1, 10, 1000);

-- 配置读写分离规则
INSERT INTO mysql_query_rules (rule_id, active, match_digest, destination_hostgroup, apply) VALUES (1, 1, '^SELECT.*FOR UPDATE$', 10, 1);
INSERT INTO mysql_query_rules (rule_id, active, match_digest, destination_hostgroup, apply) VALUES (2, 1, '^SELECT', 20, 1);

-- 加载配置到运行时
LOAD MYSQL SERVERS TO RUNTIME;
LOAD MYSQL USERS TO RUNTIME;
LOAD MYSQL QUERY RULES TO RUNTIME;

-- 保存配置到磁盘
SAVE MYSQL SERVERS TO DISK;
SAVE MYSQL USERS TO DISK;
SAVE MYSQL QUERY RULES TO DISK;
  1. 应用连接 ProxySQL
java
spring:
  datasource:
    url: jdbc:mysql://192.168.1.200:6033/test?useSSL=false&serverTimezone=UTC
    username: app
    password: password
    driver-class-name: com.mysql.cj.jdbc.Driver

MaxScale 读写分离配置

  1. 安装 MaxScale
bash
# Ubuntu/Debian
sudo apt-get install maxscale

# CentOS/RHEL
sudo yum install maxscale
  1. 配置 MaxScale
ini
# /etc/maxscale.cnf
[maxscale]
threads=auto

[server1]
type=server
address=192.168.1.100
port=3306
protocol=MySQLBackend

[server2]
type=server
address=192.168.1.101
port=3306
protocol=MySQLBackend

[server3]
type=server
address=192.168.1.102
port=3306
protocol=MySQLBackend

[MySQLMonitor]
type=monitor
module=mysqlmon
servers=server1,server2,server3
user=monitor
password=monitor_password
monitor_interval=2000

[ReadWriteSplit]
type=service
router=readwritesplit
servers=server1,server2,server3
user=maxscale
password=maxscale_password
max_slave_connections=100%

[MaxAdmin]
type=service
router=cli

[ReadWriteSplitListener]
type=listener
service=ReadWriteSplit
protocol=MySQLClient
port=4006

[MaxAdminListener]
type=listener
service=MaxAdmin
protocol=maxscaled
socket=default
  1. 启动 MaxScale
bash
systemctl start maxscale
  1. 应用连接 MaxScale
java
spring:
  datasource:
    url: jdbc:mysql://192.168.1.201:4006/test?useSSL=false&serverTimezone=UTC
    username: app
    password: password
    driver-class-name: com.mysql.cj.jdbc.Driver

优缺点

优点

  • 应用代码无需修改,透明使用
  • 集中管理数据库连接,便于维护
  • 支持多种高级功能,如负载均衡、故障检测、自动切换等
  • 跨语言支持,适合多语言应用场景

缺点

  • 增加了中间层开销,可能影响性能
  • 部署和配置复杂
  • 中间件本身可能成为单点故障
  • 某些复杂 SQL 语句可能不支持

连接池配置

连接池是管理数据库连接的组件,它可以减少连接的创建和销毁开销,提高连接利用率。

连接池核心参数

  1. 最小连接数:连接池中的最小连接数
  2. 最大连接数:连接池中的最大连接数
  3. 连接超时时间:获取连接的超时时间
  4. 空闲连接超时时间:空闲连接的超时时间
  5. 连接验证时间:连接验证的时间间隔
  6. 连接最大生命周期:连接的最大生命周期
  7. 最大等待时间:获取连接的最大等待时间

主流连接池

  1. HikariCP

    • 性能最优的连接池
    • Spring Boot 2.0+ 默认连接池
    • 配置简单,性能优异
  2. Druid

    • 阿里巴巴开源的连接池
    • 功能丰富,支持监控和统计
    • 适合生产环境使用
  3. C3P0

    • 老牌连接池,稳定性好
    • 配置复杂,性能一般
  4. DBCP

    • Apache 开源的连接池
    • 功能丰富,配置复杂

HikariCP 配置示例

yaml
spring:
  datasource:
    type: com.zaxxer.hikari.HikariDataSource
    url: jdbc:mysql://192.168.1.100:3306/test?useSSL=false&serverTimezone=UTC
    username: root
    password: password
    driver-class-name: com.mysql.cj.jdbc.Driver
    hikari:
      # 最小连接数
      minimum-idle: 5
      # 最大连接数
      maximum-pool-size: 20
      # 连接超时时间(毫秒)
      connection-timeout: 30000
      # 空闲连接超时时间(毫秒)
      idle-timeout: 600000
      # 连接最大生命周期(毫秒)
      max-lifetime: 1800000
      # 连接验证查询
      connection-test-query: SELECT 1
      # 连接池名称
      pool-name: MyHikariCP

Druid 配置示例

yaml
spring:
  datasource:
    type: com.alibaba.druid.pool.DruidDataSource
    url: jdbc:mysql://192.168.1.100:3306/test?useSSL=false&serverTimezone=UTC
    username: root
    password: password
    driver-class-name: com.mysql.cj.jdbc.Driver
    druid:
      # 初始连接数
      initial-size: 5
      # 最小连接数
      min-idle: 5
      # 最大连接数
      max-active: 20
      # 获取连接的最大等待时间(毫秒)
      max-wait: 60000
      # 验证连接的有效性
      validation-query: SELECT 1
      # 验证连接超时时间(秒)
      validation-query-timeout: 1
      # 空闲连接检查周期(毫秒)
      time-between-eviction-runs-millis: 60000
      # 连接最小生存时间(毫秒)
      min-evictable-idle-time-millis: 300000
      # 连接最大生存时间(毫秒)
      max-evictable-idle-time-millis: 900000
      # 是否在获取连接时验证
      test-on-borrow: false
      # 是否在归还连接时验证
      test-on-return: false
      # 是否在空闲时验证
      test-while-idle: true
      # 打开 PSCache
      pool-prepared-statements: true
      # PSCache 大小
      max-pool-prepared-statement-per-connection-size: 20
      # 配置监控统计拦截的 filters
      filters: stat,wall,log4j2
      # 监控配置
      stat-view-servlet:
        enabled: true
        url-pattern: /druid/*
        login-username: admin
        login-password: admin
      web-stat-filter:
        enabled: true
        url-pattern: /*
        exclusions: "*.js,*.gif,*.jpg,*.png,*.css,*.ico,/druid/*"

读写分离最佳实践

1. 数据一致性处理

  1. 设置合理的复制延迟阈值

    • 监控主从复制延迟
    • 当延迟超过阈值时,将读请求切换到主库
  2. 关键业务强制走主库

    • 对数据一致性要求高的业务,强制读主库
    • 如用户个人信息、订单信息等
  3. 使用半同步复制

    • 减少主从复制延迟
    • 提高数据一致性
  4. 使用 GTID 复制

    • 简化复制管理
    • 提高复制可靠性
  5. 实现数据校验机制

    • 定期校验主从库数据一致性
    • 及时发现和修复数据不一致问题

2. 连接池优化

  1. 合理设置连接池参数

    • 根据服务器资源和业务负载设置
    • 避免设置过大的最大连接数,导致资源耗尽
  2. 使用性能优异的连接池

    • 推荐使用 HikariCP 或 Druid
    • 避免使用性能较差的连接池
  3. 监控连接池状态

    • 监控连接池的使用率、等待时间等指标
    • 及时调整连接池参数
  4. 定期回收空闲连接

    • 设置合理的空闲连接超时时间
    • 避免连接泄漏

3. 中间件优化

  1. 选择合适的中间件

    • 根据业务需求和规模选择
    • 小规模部署可以使用 MySQL Router
    • 大规模部署推荐使用 ProxySQL 或 MaxScale
  2. 配置合理的负载均衡策略

    • 根据从库的性能和负载设置权重
    • 避免某个从库负载过高
  3. 实现中间件高可用

    • 部署多个中间件节点
    • 使用负载均衡器或 HAProxy 实现中间件的高可用
  4. 监控中间件状态

    • 监控中间件的性能、连接数、错误率等指标
    • 及时发现和解决中间件问题

4. 应用层优化

  1. 减少跨库事务

    • 尽量避免跨主从库的事务
    • 必要时使用分布式事务或最终一致性方案
  2. 优化 SQL 语句

    • 减少复杂 SQL 语句
    • 优化查询性能,减少数据库负载
  3. 实现缓存机制

    • 对热点数据进行缓存
    • 减少数据库访问次数
  4. 合理设计数据库 schema

    • 优化表结构和索引
    • 提高查询性能

不同版本的支持差异

MySQL 5.6 读写分离支持

  1. 支持传统主从复制和实验性 GTID 复制
  2. 复制延迟相对较大
  3. 并行复制支持有限,仅支持基于数据库的并行复制
  4. 半同步复制支持有限,实验性阶段
  5. 适合小规模读写分离场景

MySQL 5.7 读写分离支持

  1. 支持成熟的 GTID 复制
  2. 支持基于组提交的并行复制,减少复制延迟
  3. 支持成熟的半同步复制,提高数据一致性
  4. 支持多源复制,适合复杂场景
  5. 适合中等规模读写分离场景

MySQL 8.0 读写分离支持

  1. 增强了 GTID 复制,提高可靠性
  2. 增强了并行复制,支持 WRITESET 依赖跟踪,进一步减少复制延迟
  3. 增强了半同步复制,支持异步连接 failover
  4. 支持 replica 延迟监控,便于读写分离决策
  5. 增强了复制的安全性
  6. 适合大规模读写分离场景

常见问题与解决方案

1. 主从复制延迟

症状:从库数据落后于主库,导致读取到旧数据

解决方案

  • 优化主库和从库的硬件配置
  • 启用并行复制,增加并行复制线程数
  • 减少大事务,将大事务拆分为小事务
  • 优化网络,减少网络延迟
  • 考虑使用半同步复制或 MGR
  • 实现延迟检测机制,超过阈值时读主库

2. 数据不一致

症状:主从库数据不一致

解决方案

  • 使用 pt-table-checksum 工具检测数据一致性
  • 使用 pt-table-sync 工具修复数据不一致
  • 重新初始化从库
  • 考虑使用更可靠的复制方式,如 MGR
  • 实现数据校验机制,定期校验数据一致性

3. 中间件单点故障

症状:中间件故障导致整个系统不可用

解决方案

  • 部署多个中间件节点
  • 使用负载均衡器或 HAProxy 实现中间件的高可用
  • 实现中间件自动故障切换
  • 考虑使用无状态中间件,便于水平扩展

4. 连接池耗尽

症状:连接池连接数达到最大值,无法获取新连接

解决方案

  • 优化应用代码,减少连接占用时间
  • 增加连接池最大连接数(谨慎使用)
  • 优化 SQL 语句,提高查询性能
  • 实现连接泄漏检测机制
  • 考虑使用分布式架构,分散负载

5. 复杂 SQL 语句不支持

症状:某些复杂 SQL 语句在读写分离环境下执行失败

解决方案

  • 优化复杂 SQL 语句,简化查询逻辑
  • 对不支持的 SQL 语句强制走主库
  • 考虑使用存储过程或视图封装复杂逻辑
  • 选择对复杂 SQL 支持更好的中间件

总结

读写分离和连接池是 MySQL 数据库常用的性能优化手段,它们可以显著提高系统的整体吞吐量和响应速度。在实际应用中,需要根据业务需求、规模和团队能力选择合适的实现方案。

应用层读写分离实现简单,性能较好,但耦合度高,适合小规模部署;中间件层读写分离透明易用,功能丰富,但增加了中间层开销,适合中大规模部署。

无论选择哪种方案,都需要关注数据一致性、连接管理、监控和维护等方面的问题,采取相应的措施确保系统的稳定运行。

通过合理的读写分离和连接池配置,可以充分发挥 MySQL 数据库的性能潜力,为业务提供可靠、高效的数据服务。