Skip to content

Oracle OEM使用指南

文档目的

本文档详细介绍 Oracle Enterprise Manager (OEM) 的安装、配置、使用和最佳实践,帮助数据库管理员有效地监控和管理 Oracle 数据库系统,提高系统的可用性、可靠性和性能。

OEM 安装与配置

系统要求

  • 硬件要求
    • OMS 服务器:至少 8 核 CPU,16GB 内存,50GB 磁盘空间
    • 管理代理:至少 2 核 CPU,4GB 内存,10GB 磁盘空间
  • 软件要求
    • 操作系统:支持的 Linux、Windows 或 Unix 版本
    • Java:符合 Oracle 要求的 JDK 版本
    • 数据库:用于管理仓库的 Oracle 数据库

安装步骤

  • 准备环境
    • 配置操作系统参数
    • 安装必要的依赖包
    • 创建必要的用户和组
  • 安装管理仓库
    • 创建管理仓库数据库
    • 配置数据库参数
  • 安装 OMS
    • 运行安装程序
    • 配置 OMS 设置
    • 启动 OMS 服务
  • 安装管理代理
    • 在被管理主机上安装代理
    • 配置代理连接到 OMS

配置步骤

  • 添加目标
    • 发现和添加数据库目标
    • 发现和添加主机目标
    • 发现和添加其他目标(如监听、ASM 等)
  • 配置监控
    • 设置监控指标和阈值
    • 配置告警规则
    • 设置通知方式
  • 配置安全性
    • 创建用户和角色
    • 分配权限
    • 配置 SSL 加密

OEM 监控功能

数据库监控

  • 实例监控:监控数据库实例状态、性能和资源使用
  • 存储监控:监控表空间、数据文件和存储使用情况
  • 性能监控:监控 SQL 执行、等待事件和系统资源
  • 安全监控:监控用户活动、权限变更和安全事件

主机监控

  • 系统资源监控:监控 CPU、内存、磁盘和网络使用情况
  • 进程监控:监控系统进程和服务状态
  • 文件系统监控:监控文件系统空间和使用情况
  • 网络监控:监控网络连接和延迟

告警管理

  • 告警类型
    • 严重告警:需要立即处理的问题
    • 警告告警:需要关注的问题
    • 信息告警:提供信息性通知
  • 告警规则
    • 设置告警阈值
    • 配置告警抑制规则
    • 定义告警相关性规则
  • 告警通知
    • 电子邮件通知
    • 短信通知
    • SNMP 陷阱
    • 自定义通知

性能分析

  • 实时性能分析:实时查看数据库性能指标
  • 历史性能分析:分析历史性能数据和趋势
  • AWR 报告:生成和查看 AWR 报告
  • ADDM 分析:使用 ADDM 自动诊断性能问题

OEM 管理功能

数据库管理

  • 配置管理:管理数据库参数和配置
  • 存储管理:管理表空间、数据文件和存储
  • 用户管理:管理数据库用户和权限
  • 备份管理:配置和管理数据库备份
  • 补丁管理:管理数据库补丁和更新

作业管理

  • 作业类型
    • SQL 脚本作业
    • 操作系统命令作业
    • RMAN 备份作业
    • 数据泵导出/导入作业
  • 作业调度
    • 一次性作业
    • 定期作业
    • 事件触发作业
  • 作业监控
    • 查看作业状态和历史
    • 监控作业执行情况
    • 处理作业失败

合规性管理

  • 安全合规性:检查数据库安全配置合规性
  • 配置合规性:检查数据库配置合规性
  • 审计合规性:检查审计配置合规性
  • 合规性报告:生成合规性报告

自动化管理

  • 自动化任务
    • 自动空间管理
    • 自动性能优化
    • 自动备份和恢复
    • 自动补丁管理
  • 云控制
    • 数据库即服务 (DBaaS)
    • 中间件即服务 (MWaaS)
    • 计算即服务 (CaaS)

OEM 最佳实践

监控最佳实践

  • 关键指标监控:监控对业务影响最大的指标
  • 合理阈值设置:根据实际情况设置合理的告警阈值
  • 告警分级:对告警进行分级,优先处理严重告警
  • 定期审查:定期审查监控配置和告警历史

管理最佳实践

  • 集中管理:使用单个 OEM 实例管理所有环境
  • 角色分离:根据职责分配不同的管理角色
  • 自动化:尽可能自动化常规管理任务
  • 文档化:记录管理流程和配置

性能最佳实践

  • OMS 调优:优化 OMS 性能
  • 代理配置:合理配置代理收集频率
  • 仓库管理:定期维护和清理管理仓库
  • 网络优化:优化 OMS 和代理之间的网络连接

安全最佳实践

  • 访问控制:严格控制 OEM 访问权限
  • 密码策略:实施强密码策略
  • SSL 配置:启用 SSL 加密所有通信
  • 审计:启用 OEM 自身的审计功能

OEM 故障排除

常见问题

  • OMS 启动失败
    • 检查 OMS 日志:$OMS_HOME/sysman/log/emoms.log
    • 检查数据库连接
    • 检查端口占用
  • 代理无法连接到 OMS
    • 检查网络连接
    • 检查代理配置
    • 检查 OMS 状态
  • 监控数据不更新
    • 检查代理状态
    • 检查收集作业
    • 检查目标状态
  • 告警不触发
    • 检查告警规则配置
    • 检查阈值设置
    • 检查通知配置

日志文件

  • OMS 日志
    • emoms.log:OMS 主日志
    • emctl.log:OMS 控制日志
  • 代理日志
    • agent.log:代理主日志
    • gcagent.log:代理收集日志
  • 管理仓库日志
    • 数据库告警日志
    • 审计日志

诊断工具

  • EMCTL 命令
    • emctl status oms:检查 OMS 状态
    • emctl status agent:检查代理状态
    • emctl upload agent:强制代理上传数据
  • SQL 脚本
    • 检查管理仓库表空间
    • 检查管理仓库性能
  • OEM 内置诊断
    • 健康检查报告
    • 诊断收集工具

OEM 与其他工具集成

与监控工具集成

  • 与 Nagios 集成:通过 SNMP 集成
  • 与 Zabbix 集成:通过 API 集成
  • 与 Prometheus 集成:通过导出器集成
  • 与 Grafana 集成:通过数据源集成

与自动化工具集成

  • 与 Ansible 集成:使用 Ansible 自动化 OEM 配置
  • 与 Puppet 集成:使用 Puppet 管理 OEM 代理
  • 与 Chef 集成:使用 Chef 自动化 OEM 部署

与云服务集成

  • 与 Oracle Cloud 集成:管理 Oracle Cloud 资源
  • 与 AWS 集成:管理 AWS 上的 Oracle 资源
  • 与 Azure 集成:管理 Azure 上的 Oracle 资源

常见问题(FAQ)

Q1: 如何选择 OEM 版本?

A1: 选择 OEM 版本应考虑以下因素:

  • 管理规模:根据需要管理的目标数量选择合适的版本
  • 功能需求:根据需要的功能选择合适的版本
  • 预算:考虑软件许可和硬件成本
  • 技术支持:确保所选版本有足够的支持周期

Q2: 如何优化 OEM 的性能?

A2: 优化 OEM 性能的方法:

  • 硬件优化:为 OMS 服务器提供足够的硬件资源
  • 数据库优化:优化管理仓库数据库
  • 配置优化
    • 调整代理收集频率
    • 优化 OMS 内存配置
    • 定期清理管理仓库
  • 网络优化:确保 OMS 和代理之间的网络带宽充足

Q3: 如何配置 OEM 告警?

A3: 配置 OEM 告警的步骤:

  1. 登录 OEM 控制台
  2. 导航到:设置 > 告警 > 告警规则
  3. 创建告警规则
    • 选择目标类型
    • 选择指标
    • 设置阈值
    • 配置通知方式
  4. 测试告警:确保告警能正常触发和通知

Q4: 如何使用 OEM 进行性能分析?

A4: 使用 OEM 进行性能分析的方法:

  • 实时性能分析
    • 导航到数据库主页
    • 查看性能面板
    • 使用性能监控器
  • 历史性能分析
    • 导航到性能 > 性能中心
    • 生成 AWR 报告
    • 分析性能趋势
  • 自动性能诊断
    • 使用 ADDM 分析
    • 查看 SQL 调优顾问建议

Q5: 如何管理大量数据库目标?

A5: 管理大量数据库目标的方法:

  • 分组管理:使用组功能对目标进行逻辑分组
  • 模板应用:使用配置模板批量应用配置
  • 自动化:使用作业系统自动执行重复任务
  • 角色分离:根据职责分配管理权限
  • 监控优化:为不同类型的目标设置不同的监控策略

Q6: 如何备份和恢复 OEM?

A6: 备份和恢复 OEM 的方法:

  • 备份
    • 备份管理仓库数据库
    • 备份 OMS 配置
    • 备份代理配置
  • 恢复
    • 恢复管理仓库数据库
    • 重新配置或恢复 OMS
    • 重新配置或恢复代理
  • 最佳实践:定期备份,至少每周一次完整备份

Q7: 如何升级 OEM?

A7: 升级 OEM 的步骤:

  1. 准备工作
    • 备份管理仓库
    • 阅读升级文档
    • 测试升级路径
  2. 升级步骤
    • 升级管理仓库
    • 升级 OMS
    • 升级管理代理
  3. 验证
    • 验证 OMS 功能
    • 验证代理连接
    • 验证监控和告警

Q8: 如何使用 OEM 进行安全管理?

A8: 使用 OEM 进行安全管理的方法:

  • 安全配置
    • 配置安全模板
    • 应用安全最佳实践
  • 用户管理
    • 创建和管理用户
    • 分配角色和权限
    • 监控用户活动
  • 审计
    • 配置审计设置
    • 分析审计数据
    • 生成安全报告
  • 合规性
    • 运行合规性检查
    • 修复合规性问题
    • 跟踪合规性状态