Skip to content

OceanBase 集群部署

部署前准备

硬件准备

  • 服务器配置:建议使用至少 3 台物理服务器,每台服务器配置如下:
    • CPU:16 核及以上
    • 内存:64GB 及以上
    • 磁盘:至少 2 块 SSD,每块容量 1TB 及以上
    • 网络:万兆网卡,建议使用双网卡绑定

操作系统准备

  • 支持的操作系统:CentOS 7.x, Red Hat 7.x, SUSE Linux Enterprise Server 12.x
  • 系统参数调整
    • 关闭 SELinux
    • 关闭防火墙或配置适当的防火墙规则
    • 调整内核参数(文件句柄数、网络参数等)
    • 安装必要的依赖包

网络准备

  • 配置静态 IP 地址
  • 配置主机名和 DNS 解析
  • 配置 SSH 免密登录
  • 测试节点间网络连通性

部署方式选择

使用 OBD 部署

  • 适用场景:小规模集群部署,快速部署验证
  • 优势:操作简单,自动化程度高,支持一键部署
  • 劣势:大规模集群管理能力有限

使用 OCP 部署

  • 适用场景:大规模生产环境部署,长期集群管理
  • 优势:可视化管理,支持大规模集群,提供全面的监控和运维功能
  • 劣势:部署复杂,需要额外的资源投入

手动部署

  • 适用场景:特殊环境部署,需要完全自定义配置
  • 优势:高度定制化,适合特殊环境需求
  • 劣势:操作复杂,容易出错,维护成本高

集群部署步骤

使用 OBD 部署集群

1. 安装 OBD

bash
# 添加 OceanBase 官方仓库
yum install -y yum-utils
yum-config-manager --add-repo https://mirrors.aliyun.com/oceanbase/OceanBase.repo

# 安装 OBD
yum install -y ob-deploy

# 验证 OBD 安装
obd --version

2. 准备部署配置文件

yaml
# obd cluster deploy 配置文件示例
user: admin
oceanbase-ce:
  servers:
    - name: server1
      ip: 10.0.0.1
    - name: server2
      ip: 10.0.0.2
    - name: server3
      ip: 10.0.0.3
  global:
    home_path: /home/admin/oceanbase
    data_dir: /data/oceanbase/data
    log_dir: /data/oceanbase/log
    devname: eth0
    cluster_id: 1
    memory_limit: 64G
    system_memory: 8G
    cpu_count: 16
    datafile_size: 100G
    log_disk_size: 100G

3. 部署集群

bash
# 部署集群
obd cluster deploy <cluster-name> -c <config-file>

# 启动集群
obd cluster start <cluster-name>

# 查看集群状态
obd cluster display <cluster-name>

使用 OCP 部署集群

1. 部署 OCP

  • 准备 OCP 部署所需的资源
  • 安装 OCP 基础环境
  • 部署 OCP 服务
  • 访问 OCP 控制台

2. 在 OCP 中部署 OceanBase 集群

  1. 登录 OCP 控制台
  2. 点击 "创建集群" 按钮
  3. 填写集群基本信息(集群名称、版本、地域等)
  4. 添加集群节点,配置节点信息
  5. 配置集群参数(内存、CPU、存储等)
  6. 确认部署配置,开始部署
  7. 等待部署完成,验证集群状态

部署后验证

集群状态验证

  • 检查集群整体状态是否正常
  • 验证所有节点是否正常加入集群
  • 检查分区副本分布是否合理

服务可用性验证

  • 测试客户端连接
  • 执行基本的 SQL 操作(创建表、插入数据、查询数据)
  • 验证读写操作是否正常

性能验证

  • 执行性能测试,验证集群性能是否符合预期
  • 监控资源使用情况(CPU、内存、磁盘、网络)
  • 检查 IO 性能和响应时间

常见问题(FAQ)

Q1: 部署过程中提示节点连接失败怎么办?

A1: 检查以下几点:

  • 确认节点间网络连通性
  • 确认 SSH 免密登录配置正确
  • 确认防火墙配置正确,允许 SSH 访问
  • 确认目标节点上的 admin 用户存在且权限正确

Q2: 部署完成后,集群状态显示异常怎么办?

A2: 执行以下操作:

  • 查看节点日志,定位异常原因
  • 检查配置参数是否正确
  • 验证资源配置是否满足要求
  • 尝试重启集群或有问题的节点

Q3: 如何扩展已部署的集群?

A3: 集群扩展方法:

  • 使用 OBD 或 OCP 添加新节点
  • 配置新节点的资源参数
  • 将新节点加入集群
  • 迁移副本到新节点,平衡集群负载

Q4: 部署过程中遇到磁盘空间不足怎么办?

A4: 解决方法:

  • 清理目标节点上的磁盘空间
  • 调整数据文件和日志文件的大小配置
  • 使用更大容量的磁盘
  • 考虑使用多磁盘配置

Q5: 如何备份和恢复集群配置?

A5: 配置备份和恢复方法:

  • 使用 OBD 导出集群配置
  • 使用 OCP 备份集群配置
  • 手动备份配置文件
  • 恢复时,使用备份的配置重新部署或调整集群