DB2 pureScale 架构

pureScale概述

DB2 pureScale是IBM推出的高可用性集群解决方案，基于共享磁盘架构，提供近乎线性的扩展性和高可用性。它结合了IBM大型机的可靠性和分布式系统的灵活性，适用于需要高吞吐量和连续可用性的关键业务应用。

pureScale架构组件

1. 成员（Members）

执行数据库事务的核心组件
每个成员都是独立的DB2实例
共享同一套数据库目录和表空间
可以动态添加或移除成员
支持读写操作，实现负载均衡

2. 集群缓存设施（Cluster Caching Facility，简称CF）

管理全局缓存和锁状态
确保数据一致性和并发控制
协调成员之间的通信
提供高可用性（通常部署2个CF：主CF和备CF）
包含两个主要组件：
- 锁管理器（Lock Manager）：管理全局锁
- 共享数据缓存（Shared Data Cache）：缓存经常访问的数据页

3. 高速互联网络（High-Speed Interconnect）

连接所有成员和CF
提供低延迟、高带宽的通信
支持InfiniBand、RoCE或以太网
确保成员和CF之间的高效通信

4. 共享存储

所有成员共享同一套存储
通常使用SAN或NAS存储
支持多种存储协议（FC、iSCSI等）
包含数据库数据、日志和配置文件

5. 故障监控和恢复组件

集群管理软件（RSCT - Reliable Scalable Cluster Technology）
监控集群成员和CF的状态
检测故障并自动触发恢复操作
管理成员和CF的启动、停止和故障转移

pureScale工作原理

1. 事务处理流程

客户端连接到任意成员
成员解析SQL并生成执行计划
成员向CF请求所需数据页的锁
CF授予锁并返回数据页（如果在缓存中）
如果数据页不在CF缓存中，成员从共享存储读取
成员执行事务并更新数据页
成员将更新的日志记录写入本地日志缓冲
日志缓冲刷新到共享存储上的日志文件
成员通知CF释放锁并更新缓存

2. 并发控制机制

全局锁管理：所有锁由CF统一管理，确保数据一致性
乐观并发控制：允许成员先读取数据，在提交时检查冲突
共享数据缓存：CF缓存热点数据，减少成员对共享存储的访问
两阶段提交：确保分布式事务的原子性

3. 故障检测与恢复

心跳机制：成员和CF之间定期发送心跳信号
故障检测：当心跳超时，RSCT检测到故障
自动恢复：
- 如果成员故障，RSCT会：
  1. 通知CF释放该成员持有的所有锁
  2. 清理该成员的资源
  3. 客户端自动重定向到其他可用成员
- 如果主CF故障，备CF会立即接管，无需中断服务

pureScale部署模式

1. 标准部署

2个或更多成员
2个CF（主CF和备CF）
共享存储
高速互联网络
适用于大多数生产环境

2. 精简部署

1个成员和1个CF
适用于测试和开发环境
不提供高可用性，仅用于功能验证

3. 地理分布式部署

成员和CF分布在不同地理位置
共享存储通过远程复制技术实现
提供跨地域的高可用性
适用于灾难恢复场景

pureScale配置参数

核心配置参数

参数名称	描述	默认值
DB2_SKIPINSERTED	控制跳过已删除行的行为	OFF
DB2_USE_ALTERNATE_PAGE_CLEANING	启用替代页清理策略	ON
DB2_PARALLEL_IO	配置并行I/O行为	*
LOCKLIST	锁列表大小	AUTOMATIC
MAXLOCKS	每个应用程序的最大锁百分比	AUTOMATIC
CF_MEM_SZ	CF内存大小	AUTOMATIC

配置示例

bash

# 配置成员数量
db2 update dbm cfg using INSTANCE_MEMORY AUTOMATIC

# 配置CF内存
db2 update dbm cfg using CF_MEM_SZ AUTOMATIC

# 配置并行I/O
db2 update dbm cfg using DB2_PARALLEL_IO *

# 启用替代页清理策略
db2 update db cfg for <dbname> using DB2_USE_ALTERNATE_PAGE_CLEANING ON

pureScale管理命令

1. 查看集群状态

bash

# 查看集群状态
db2instance -list

# 查看CF状态
db2pd -cf

# 查看成员状态
db2pd -mem

2. 管理成员

bash

# 添加成员
db2iupdt -add -m <member_name> -i <instance_name> <instance_home>

# 移除成员
db2iupdt -remove -m <member_name> -i <instance_name> <instance_home>

# 启动成员
db2start member <member_number>

# 停止成员
db2stop member <member_number>

3. 管理CF

bash

# 启动CF
db2start cf <cf_number>

# 停止CF
db2stop cf <cf_number>

# 切换CF角色
db2set -g DB2_CF_PRIMARY=<new_primary_cf>

pureScale性能优化

1. 成员和CF配置

根据工作负载调整成员数量
确保CF有足够的内存
配置适当的网络带宽
监控CF的CPU利用率

2. 存储优化

使用高性能存储设备
配置适当的存储RAID级别
优化存储I/O调度
使用多个LUN分散I/O负载

3. 应用程序优化

减少锁竞争
优化事务大小
合理使用连接池
避免长事务

版本差异

版本	pureScale功能差异
DB2 10.1	首次引入pureScale，支持AIX和Linux平台
DB2 10.5	增强了性能和可扩展性，支持更多硬件平台
DB2 11.1	改进了故障恢复机制，支持更灵活的部署选项
DB2 11.5	引入了更多自动化管理功能，支持容器化部署

生产实践

1. pureScale部署最佳实践

1.1 硬件配置建议

成员节点：
- CPU：8核以上，高频处理器（建议3.0GHz+）
- 内存：至少16GB，建议32GB以上
- 存储：本地SSD用于日志缓冲，共享存储用于数据
- 网络：10GbE或InfiniBand高速网络
CF节点：
- CPU：4核以上，高频处理器
- 内存：建议32GB以上（根据数据库大小调整）
- 网络：优先使用InfiniBand，确保低延迟
共享存储：
- 建议使用全闪存阵列（AFA）
- 配置足够的带宽和IOPS
- 实现存储级别的冗余（RAID 10）
- 分离日志和数据存储

1.2 网络配置实践

网络分离：
- 将成员间通信、CF通信和客户端通信分离到不同网络
- 使用VLAN隔离不同类型的流量

网络监控：

bash

# 监控网络延迟
ibping -c 10 -f <destination>

# 监控网络带宽
ibstat

# 监控网络错误
ifconfig -a

2. pureScale性能调优实践

2.1 CF内存优化

案例背景：CF内存不足导致性能瓶颈

调优方法：

bash

# 监控CF内存使用情况
db2pd -cf -mem

# 调整CF内存大小
db2 update dbm cfg using CF_MEM_SZ 32768

# 重启CF使配置生效
db2stop cf <cf_number>
db2start cf <cf_number>

2.2 锁竞争优化

问题：高并发场景下锁竞争导致性能下降

解决方案：

sql

-- 分析锁等待情况
SELECT * FROM TABLE(MON_GET_LOCKWAIT(NULL)) AS LW;

-- 减少锁持有时间
-- 1. 优化事务大小，避免长事务
-- 2. 使用行级锁而非表级锁
-- 3. 合理设置隔离级别

-- 调整锁列表大小
db2 update db cfg for <dbname> using LOCKLIST AUTOMATIC
db2 update db cfg for <dbname> using MAXLOCKS AUTOMATIC

2.3 页清理策略优化

配置替代页清理策略：

bash

# 启用替代页清理策略
db2 update db cfg for <dbname> using DB2_USE_ALTERNATE_PAGE_CLEANING ON

# 调整页清理器数量
db2 update db cfg for <dbname> using NUM_IOCLEANERS AUTOMATIC
db2 update db cfg for <dbname> using NUM_PAGE_CLEANERS AUTOMATIC

3. pureScale故障管理实践

3.1 故障演练与恢复

定期故障演练：

bash

# 模拟成员故障
db2stop member <member_number> force

# 验证故障转移
db2instance -list

# 恢复成员
db2start member <member_number>

3.2 自动客户端重新路由（ACR）配置

配置ACR：

bash

# 启用ACR
db2 update alternate server for database <dbname> using member <member_number> hostname <host> port <port>

# 配置连接重试
db2 update dbm cfg using MAX_CONNECT_RETRIES 5
db2 update dbm cfg using CONNECT_RETRY_DELAY 2

4. pureScale监控实践

4.1 关键监控指标

成员监控：

bash

# 监控成员状态和性能
db2pd -d <dbname> -member
db2pd -d <dbname> -transaction
db2pd -d <dbname> -locks

CF监控：

bash

# 监控CF状态和性能
db2pd -cf -status
db2pd -cf -locks
db2pd -cf -cache

集群监控：

bash

# 监控集群状态
db2instance -list

# 监控RSCT状态
lssrc -g rsct

4.2 监控脚本示例

bash

#!/bin/bash
# purescale_monitor.sh - 监控pureScale集群状态

DB_NAME="mydb"
OUTPUT_FILE="/var/log/purescale_monitor_$(date +%Y%m%d_%H%M%S).log"

# 记录监控时间
echo "=== pureScale监控报告 - $(date) ===" > $OUTPUT_FILE

# 1. 集群状态
echo -e "\n1. 集群状态:" >> $OUTPUT_FILE
db2instance -list >> $OUTPUT_FILE

# 2. 成员状态
echo -e "\n2. 成员状态:" >> $OUTPUT_FILE
db2pd -d $DB_NAME -member >> $OUTPUT_FILE

# 3. CF状态
echo -e "\n3. CF状态:" >> $OUTPUT_FILE
db2pd -cf -status >> $OUTPUT_FILE

# 4. 锁状态
echo -e "\n4. 锁状态:" >> $OUTPUT_FILE
db2pd -d $DB_NAME -locks >> $OUTPUT_FILE

# 5. 事务状态
echo -e "\n5. 事务状态:" >> $OUTPUT_FILE
db2pd -d $DB_NAME -transaction >> $OUTPUT_FILE

# 6. 网络状态
echo -e "\n6. 网络状态:" >> $OUTPUT_FILE
ibstat >> $OUTPUT_FILE

# 7. 存储状态
echo -e "\n7. 存储状态:" >> $OUTPUT_FILE
iostat -x 1 5 >> $OUTPUT_FILE

echo -e "\n=== 监控结束 ===" >> $OUTPUT_FILE

# 检查异常情况
if grep -q "FAILED" $OUTPUT_FILE || grep -q "UNAVAILABLE" $OUTPUT_FILE; then
  # 发送告警邮件
  mail -s "pureScale集群异常" admin@example.com < $OUTPUT_FILE
fi

5. pureScale维护实践

5.1 成员滚动升级

升级步骤：
1. 准备升级包
2. 停止一个成员：
  bash
```
db2stop member <member_number>
```
3. 升级该成员
4. 启动成员：
  bash
```
db2start member <member_number>
```
5. 验证成员状态：
  bash
```
db2instance -list
```
6. 对其他成员重复上述步骤
7. 升级CF（先备CF，后主CF）

5.2 备份与恢复策略

备份策略：

使用DB2内置备份工具：
bash
```
db2 backup database <dbname> to /backup
```

实现增量备份：

bash

db2 backup database <dbname> online incremental to /backup

定期验证备份完整性：
bash
```
db2ckbkp /backup/*.001
```

恢复策略：

测试恢复流程：

bash

db2 restore database <dbname> from /backup replace existing

实现Point-In-Time Recovery (PITR)：

bash

db2 restore database <dbname> from /backup taken at <timestamp> until <point_in_time> replace existing

6. pureScale容器化实践

6.1 Kubernetes部署

案例背景：企业希望在Kubernetes上部署pureScale，实现容器化管理

实施步骤：

准备Kubernetes集群
部署共享存储（如IBM Spectrum Scale或NFS）
配置网络（建议使用Calico或Flannel）

使用Helm部署pureScale：

bash

helm repo add ibm-charts https://raw.githubusercontent.com/IBM/charts/master/repo/stable/
helm install my-purescale ibm-charts/ibm-db2-purescale

验证部署：

bash

kubectl get pods
kubectl exec -it <member-pod> -- db2instance -list

常见问题（FAQ）

Q1: pureScale支持哪些操作系统？

A1: pureScale支持AIX和Linux（RHEL、SLES）操作系统，不支持Windows平台。

Q2: pureScale与传统HADR有什么区别？

A2: pureScale和HADR的主要区别：

pureScale基于共享磁盘架构，成员共享同一套存储；HADR基于主备架构，数据通过日志复制同步
pureScale支持多个成员同时处理事务，实现负载均衡；HADR只有主库处理事务
pureScale提供亚秒级故障切换；HADR故障切换时间通常为秒级
pureScale适用于高吞吐量场景；HADR适用于灾难恢复场景

Q3: pureScale需要多少个节点？

A3: pureScale的最小配置为1个成员和1个CF（用于测试），生产环境建议配置：

至少2个成员，实现负载均衡
2个CF（主CF和备CF），实现高可用性

Q4: pureScale如何处理成员故障？

A4: 当成员故障时：

RSCT检测到故障
CF释放该成员持有的所有锁
清理该成员的资源
客户端通过自动客户端重新路由（ACR）连接到其他可用成员
故障成员可以修复后重新加入集群

Q5: pureScale支持动态扩展吗？

A5: 是的，pureScale支持动态扩展：

可以在线添加或移除成员
无需停机或重启数据库
支持近乎线性的性能扩展

Q6: pureScale的许可证是如何计算的？

A6: pureScale的许可证通常基于：

成员数量
每个成员的CPU核心数
具体的许可证类型（标准版、企业版等）

Q7: 如何监控pureScale集群？

A7: 可以使用以下工具监控pureScale集群：

DB2命令：db2instance -list、db2pd -cf、db2pd -mem
IBM Data Studio或IBM Cloud Pak for Data
操作系统工具：top、vmstat、iostat等
第三方监控工具：Nagios、Zabbix等

Q8: pureScale适合什么样的应用场景？

A8: pureScale适用于以下场景：

高吞吐量的在线事务处理（OLTP）系统
需要连续可用性的关键业务应用
数据量增长迅速，需要灵活扩展的系统
对故障恢复时间要求极高的应用

Q9: pureScale的存储要求是什么？

A9: pureScale对存储的要求：

共享存储（SAN或NAS）
支持并发访问
低延迟、高带宽
支持多种存储协议（FC、iSCSI等）
建议使用RAID 10或类似的冗余配置

Q10: 如何迁移到pureScale？

A10: 迁移到pureScale的主要步骤：

评估现有环境和工作负载
规划pureScale架构和配置
部署pureScale集群
迁移数据库（使用备份恢复或数据库复制）
测试应用程序兼容性
逐步切换生产流量
监控和优化性能

pureScale与其他高可用解决方案的比较

特性	DB2 pureScale	DB2 HADR	传统集群
架构类型	共享磁盘	主备复制	共享磁盘或共享 nothing
扩展性	近乎线性	有限	有限
故障切换时间	亚秒级	秒级	分钟级
负载均衡	支持	不支持	部分支持
跨地域部署	支持	支持	有限支持
管理复杂度	中等	低	高
硬件成本	高	中	中

DB2 pureScale 架构 ​

pureScale概述 ​

pureScale架构组件 ​

1. 成员（Members） ​

2. 集群缓存设施（Cluster Caching Facility，简称CF） ​

3. 高速互联网络（High-Speed Interconnect） ​

4. 共享存储 ​

5. 故障监控和恢复组件 ​

pureScale工作原理 ​

1. 事务处理流程 ​

2. 并发控制机制 ​

3. 故障检测与恢复 ​

pureScale部署模式 ​

1. 标准部署 ​

2. 精简部署 ​

3. 地理分布式部署 ​

pureScale配置参数 ​

核心配置参数 ​

配置示例 ​

pureScale管理命令 ​

1. 查看集群状态 ​

2. 管理成员 ​

3. 管理CF ​

pureScale性能优化 ​

1. 成员和CF配置 ​

2. 存储优化 ​

3. 应用程序优化 ​

版本差异 ​

生产实践 ​

1. pureScale部署最佳实践 ​

1.1 硬件配置建议 ​

1.2 网络配置实践 ​

2. pureScale性能调优实践 ​

2.1 CF内存优化 ​

2.2 锁竞争优化 ​

2.3 页清理策略优化 ​

3. pureScale故障管理实践 ​

3.1 故障演练与恢复 ​

3.2 自动客户端重新路由（ACR）配置 ​

4. pureScale监控实践 ​

4.1 关键监控指标 ​

4.2 监控脚本示例 ​

5. pureScale维护实践 ​

5.1 成员滚动升级 ​

5.2 备份与恢复策略 ​

6. pureScale容器化实践 ​

6.1 Kubernetes部署 ​

常见问题（FAQ） ​

Q1: pureScale支持哪些操作系统？ ​

Q2: pureScale与传统HADR有什么区别？ ​

Q3: pureScale需要多少个节点？ ​

Q4: pureScale如何处理成员故障？ ​

Q5: pureScale支持动态扩展吗？ ​

Q6: pureScale的许可证是如何计算的？ ​

Q7: 如何监控pureScale集群？ ​

Q8: pureScale适合什么样的应用场景？ ​

Q9: pureScale的存储要求是什么？ ​

Q10: 如何迁移到pureScale？ ​

pureScale与其他高可用解决方案的比较 ​

DB2 pureScale 架构

pureScale概述

pureScale架构组件

1. 成员（Members）

2. 集群缓存设施（Cluster Caching Facility，简称CF）

3. 高速互联网络（High-Speed Interconnect）

4. 共享存储

5. 故障监控和恢复组件

pureScale工作原理

1. 事务处理流程

2. 并发控制机制

3. 故障检测与恢复

pureScale部署模式

1. 标准部署

2. 精简部署

3. 地理分布式部署

pureScale配置参数

核心配置参数

配置示例

pureScale管理命令

1. 查看集群状态

2. 管理成员

3. 管理CF

pureScale性能优化

1. 成员和CF配置

2. 存储优化

3. 应用程序优化

版本差异

生产实践

1. pureScale部署最佳实践

1.1 硬件配置建议

1.2 网络配置实践

2. pureScale性能调优实践

2.1 CF内存优化

2.2 锁竞争优化

2.3 页清理策略优化

3. pureScale故障管理实践

3.1 故障演练与恢复

3.2 自动客户端重新路由（ACR）配置

4. pureScale监控实践

4.1 关键监控指标

4.2 监控脚本示例

5. pureScale维护实践

5.1 成员滚动升级

5.2 备份与恢复策略

6. pureScale容器化实践

6.1 Kubernetes部署

常见问题（FAQ）

Q1: pureScale支持哪些操作系统？

Q2: pureScale与传统HADR有什么区别？

Q3: pureScale需要多少个节点？

Q4: pureScale如何处理成员故障？

Q5: pureScale支持动态扩展吗？

Q6: pureScale的许可证是如何计算的？

Q7: 如何监控pureScale集群？

Q8: pureScale适合什么样的应用场景？

Q9: pureScale的存储要求是什么？

Q10: 如何迁移到pureScale？

pureScale与其他高可用解决方案的比较