Redis 物理架构

Redis进程模型

单进程模型

Redis采用单进程模型，所有命令都在一个进程中执行。

主进程

负责处理客户端命令、内存管理、持久化等核心功能
单线程执行命令，避免线程切换开销
进程号通常存储在/var/run/redis/redis-server.pid文件中

子进程

用于执行BGSAVE命令生成RDB文件
用于执行BGREWRITEAOF命令重写AOF文件
子进程由主进程通过fork()创建，共享主进程的内存空间（写时复制）

主从复制中的进程关系

每个Redis实例都是一个独立的进程
主节点和从节点之间通过网络通信
从节点作为独立进程运行，复制主节点的数据

Redis 6.0+的多线程模型

Redis 6.0引入了多线程I/O，但命令执行仍然是单线程的。

I/O线程

专门负责网络I/O操作
默认创建4个I/O线程（可通过配置调整）
不参与命令执行，只处理网络数据传输

主线程

负责命令解析和执行
管理内存和数据结构
处理持久化和复制

Redis内存结构

Redis的内存结构主要包括以下几个部分：

内存分配器

Redis使用内存分配器管理内存空间，支持多种分配器：

jemalloc

Redis默认使用的内存分配器
高效的内存分配策略
减少内存碎片
支持多种内存大小的分配

tcmalloc

Google开发的内存分配器
适合多线程环境
内存分配速度快

libc malloc

标准C库的内存分配器
兼容性好，但性能相对较低
内存碎片较多

内存布局

Redis的内存主要分为以下几个区域：

数据区

存储实际的数据内容
包括所有键值对数据
是Redis内存使用的主要部分

进程堆栈

存储函数调用栈和局部变量
大小相对固定
通常在几MB到几十MB之间

内存碎片

由于内存分配和释放产生的未使用内存
影响内存利用率
可通过内存分配器优化

其他内存

存储Redis内部数据结构
存储客户端连接信息
存储命令缓冲区
存储复制缓冲区

内存统计

Redis提供了多种命令用于查看内存使用情况：

INFO memory

显示详细的内存使用统计信息
包括总内存、已使用内存、内存碎片率等
支持实时监控内存使用情况

MEMORY USAGE key

查看单个键占用的内存大小
包括键名和键值的内存
支持递归计算（如Hash、List等复杂类型）

MEMORY STATS

显示详细的内存统计信息
包括内存分配器统计、内存碎片统计等
提供更深入的内存使用分析

Redis文件系统组织

Redis在文件系统中涉及的主要文件包括配置文件、数据文件、日志文件等。

配置文件

主配置文件

默认位置：/etc/redis/redis.conf
包含Redis的所有配置选项
支持包括持久化、网络、安全等方面的配置

配置文件格式

采用键值对格式
支持注释（以#开头）
支持包含其他配置文件

数据文件

RDB文件

存储Redis数据的快照
默认文件名：dump.rdb
存储位置可通过配置文件中的dir和dbfilename参数指定
支持压缩存储

AOF文件

存储所有写命令的日志
默认文件名：appendonly.aof
存储位置与RDB文件相同
支持重写机制，减少文件大小

日志文件

记录Redis的运行日志
默认输出到标准输出
可通过配置文件中的logfile参数指定文件路径
支持不同的日志级别：debug、verbose、notice、warning

慢查询日志

记录执行时间超过阈值的命令
默认禁用，可通过配置文件启用
日志文件位置与主日志相同
可配置日志大小和保留时间

其他文件

PID文件

存储Redis进程的PID
默认位置：/var/run/redis/redis-server.pid
用于进程管理和监控

Socket文件

用于本地客户端连接
默认位置：/var/run/redis/redis-server.sock
仅在启用Unix socket时创建

Redis网络通信

网络协议

Redis使用TCP/IP协议进行网络通信，默认端口为6379。

TCP/IP通信

客户端与服务器之间通过TCP连接通信
支持长连接，减少连接建立开销
默认超时时间为0（永不超时）

Unix Socket通信

支持本地客户端通过Unix socket连接
通信速度比TCP/IP快
仅适用于本地连接

连接管理

最大连接数

默认最大连接数为10000
可通过配置文件中的maxclients参数调整
超过最大连接数时，新连接会被拒绝

连接超时

可通过配置文件中的timeout参数设置
默认值为0，表示永不超时
超时后自动关闭空闲连接

连接缓冲区

每个连接有输入缓冲区和输出缓冲区
输入缓冲区存储客户端发送的命令
输出缓冲区存储服务器返回的响应
缓冲区大小可通过配置文件调整

Redis持久化机制的物理实现

RDB持久化的物理实现

RDB持久化通过以下步骤实现：

主进程执行BGSAVE命令
主进程fork()创建子进程
子进程遍历内存中的数据，生成RDB文件
子进程完成RDB文件生成后，通知主进程
主进程更新RDB文件的元数据

RDB文件格式

二进制格式，包含版本号、数据库数量、键值对数据等
支持压缩，可通过配置文件中的rdbcompression参数启用
包含校验和，用于验证文件完整性

AOF持久化的物理实现

AOF持久化通过以下步骤实现：

客户端发送写命令
命令被追加到AOF缓冲区
根据同步策略，缓冲区内容被写入AOF文件
AOF文件会定期进行重写，减少文件大小

AOF文件格式

文本格式，存储Redis命令
支持不同的同步策略：always、everysec、no
重写后的AOF文件包含重建当前数据所需的最少命令

混合持久化的物理实现

混合持久化结合了RDB和AOF的优点：

AOF文件头部包含RDB格式的快照
AOF文件后续包含增量的写命令
恢复时先加载RDB快照，然后执行AOF命令

Redis主从复制的物理实现

主从复制的网络通信

主从复制通过TCP/IP协议实现：

从节点通过TCP连接连接到主节点
从节点发送SYNC命令请求同步
主节点生成RDB文件并发送给从节点
主节点将增量写命令发送给从节点
从节点执行这些命令，保持数据一致

复制缓冲区

主节点维护复制缓冲区，用于存储待发送给从节点的写命令：

复制缓冲区是一个固定大小的环形缓冲区
大小可通过配置文件中的repl-backlog-size参数调整
当缓冲区满时，旧的命令会被覆盖

复制偏移量

主节点和从节点都维护复制偏移量：

主节点记录已发送的命令字节数
从节点记录已接收的命令字节数
通过比较偏移量，主节点可以确定从节点需要同步的命令

Redis Cluster的物理实现

集群节点的物理结构

Redis Cluster由多个独立的Redis节点组成：

每个节点是一个独立的Redis进程
节点之间通过TCP连接通信
每个节点负责一部分哈希槽

集群通信

集群节点之间通过Gossip协议通信：

节点定期发送ping消息，包含节点状态信息
节点通过pong消息响应
消息包含节点的哈希槽分配信息
支持节点发现和故障检测

集群文件

每个集群节点维护以下文件：

nodes.conf：存储集群节点的配置信息
包含节点ID、IP地址、端口号、哈希槽分配等
自动生成和更新

Redis物理架构的性能优化

内存优化

内存分配器选择

优先选择jemalloc或tcmalloc
减少内存碎片
提高内存分配效率

内存淘汰策略

根据业务需求选择合适的淘汰策略
常用策略：LRU、LFU、TTL等
避免内存溢出

大key处理

识别并拆分大key
减少单个命令的执行时间
降低内存使用峰值

进程优化

进程优先级

可通过renice命令调整Redis进程优先级
提高Redis进程的CPU优先级
减少被操作系统调度中断的概率

关闭不必要的进程

减少系统资源竞争
提高Redis的资源利用率
降低系统负载

文件系统优化

选择合适的文件系统

推荐使用ext4或xfs文件系统
提高文件I/O性能
减少文件系统开销

关闭文件系统atime

减少磁盘I/O操作
提高文件系统性能
可通过挂载选项noatime实现

网络优化

调整TCP参数

调整TCP缓冲区大小
启用TCP快速打开
优化TCP连接超时设置

使用Unix Socket

对于本地连接，优先使用Unix socket
提高通信速度
减少网络开销

常见问题（FAQ）

Q1: Redis的单进程模型会导致CPU利用率不高吗？

A1: Redis的单进程模型确实会导致单个Redis实例无法充分利用多核CPU，但这是设计权衡的结果。单进程模型避免了线程切换和锁竞争的开销，简化了并发控制，适合处理大量短命令。对于需要利用多核CPU的场景，可以部署多个Redis实例或使用Redis Cluster。

Q2: Redis的子进程会占用大量内存吗？

A2: Redis的子进程通过fork()创建，使用写时复制（Copy-on-Write）机制，初始时不会占用额外的内存。只有当主进程或子进程修改数据时，才会复制相应的内存页。因此，子进程通常不会占用大量内存，但在数据量大且修改频繁的情况下，可能会导致内存使用增加。

Q3: Redis的AOF文件为什么会变得很大？

A3: AOF文件会记录所有写命令，随着时间的推移会变得越来越大。Redis提供了BGREWRITEAOF命令用于重写AOF文件，只保留重建当前数据所需的最少命令，从而减少AOF文件的大小。可以通过配置文件中的auto-aof-rewrite-percentage和auto-aof-rewrite-min-size参数自动触发AOF重写。

Q4: Redis的最大连接数受哪些因素限制？

A4: Redis的最大连接数受以下因素限制：

配置文件中的maxclients参数
操作系统的文件描述符限制
系统内存大小（每个连接需要一定的内存）

在调整maxclients参数之前，需要确保操作系统的文件描述符限制足够高。

Q5: 如何监控Redis的物理资源使用情况？

A5: 可以通过以下方式监控Redis的物理资源使用情况：

使用INFO memory命令查看内存使用情况
使用INFO clients命令查看客户端连接情况
使用top或htop命令查看Redis进程的CPU和内存使用
使用netstat或ss命令查看Redis的网络连接
使用监控工具如Prometheus+Grafana进行全面监控

通过监控Redis的物理资源使用情况，可以及时发现并解决性能问题，确保Redis的稳定运行。

Redis 物理架构 ​

Redis进程模型 ​

单进程模型 ​

主进程 ​

子进程 ​

主从复制中的进程关系 ​

Redis 6.0+的多线程模型 ​

I/O线程 ​

主线程 ​

Redis内存结构 ​

内存分配器 ​

jemalloc ​

tcmalloc ​

libc malloc ​

内存布局 ​

数据区 ​

进程堆栈 ​

内存碎片 ​

其他内存 ​

内存统计 ​

INFO memory ​

MEMORY USAGE key ​

MEMORY STATS ​

Redis文件系统组织 ​

配置文件 ​

主配置文件 ​

配置文件格式 ​

数据文件 ​

RDB文件 ​

AOF文件 ​

日志文件 ​

日志文件 ​

慢查询日志 ​

其他文件 ​

PID文件 ​

Socket文件 ​

Redis网络通信 ​

网络协议 ​

TCP/IP通信 ​

Unix Socket通信 ​

连接管理 ​

最大连接数 ​

连接超时 ​

连接缓冲区 ​

Redis持久化机制的物理实现 ​

RDB持久化的物理实现 ​

RDB文件格式 ​

AOF持久化的物理实现 ​

AOF文件格式 ​

混合持久化的物理实现 ​

Redis主从复制的物理实现 ​

主从复制的网络通信 ​

复制缓冲区 ​

复制偏移量 ​

Redis Cluster的物理实现 ​

集群节点的物理结构 ​

集群通信 ​

集群文件 ​

Redis物理架构的性能优化 ​

内存优化 ​

内存分配器选择 ​

内存淘汰策略 ​

大key处理 ​

进程优化 ​

进程优先级 ​

关闭不必要的进程 ​

文件系统优化 ​

选择合适的文件系统 ​

关闭文件系统atime ​

网络优化 ​

调整TCP参数 ​

使用Unix Socket ​

常见问题（FAQ） ​

Q1: Redis的单进程模型会导致CPU利用率不高吗？ ​

Q2: Redis的子进程会占用大量内存吗？ ​

Q3: Redis的AOF文件为什么会变得很大？ ​

Q4: Redis的最大连接数受哪些因素限制？ ​

Q5: 如何监控Redis的物理资源使用情况？ ​

Redis 物理架构

Redis进程模型

单进程模型

主进程

子进程

主从复制中的进程关系

Redis 6.0+的多线程模型

I/O线程

主线程

Redis内存结构

内存分配器

jemalloc

tcmalloc

libc malloc

内存布局

数据区

进程堆栈

内存碎片

其他内存

内存统计

INFO memory

MEMORY USAGE key

MEMORY STATS

Redis文件系统组织

配置文件

主配置文件

配置文件格式

数据文件

RDB文件

AOF文件

日志文件

日志文件

慢查询日志

其他文件

PID文件

Socket文件

Redis网络通信

网络协议

TCP/IP通信

Unix Socket通信

连接管理

最大连接数

连接超时

连接缓冲区

Redis持久化机制的物理实现

RDB持久化的物理实现

RDB文件格式

AOF持久化的物理实现

AOF文件格式

混合持久化的物理实现

Redis主从复制的物理实现

主从复制的网络通信

复制缓冲区

复制偏移量

Redis Cluster的物理实现

集群节点的物理结构

集群通信

集群文件

Redis物理架构的性能优化

内存优化

内存分配器选择

内存淘汰策略

大key处理

进程优化

进程优先级

关闭不必要的进程

文件系统优化

选择合适的文件系统

关闭文件系统atime

网络优化

调整TCP参数

使用Unix Socket

常见问题（FAQ）

Q1: Redis的单进程模型会导致CPU利用率不高吗？

Q2: Redis的子进程会占用大量内存吗？

Q3: Redis的AOF文件为什么会变得很大？

Q4: Redis的最大连接数受哪些因素限制？

Q5: 如何监控Redis的物理资源使用情况？