intra-mart Accel Platform 配置文件参考 第26版2020-08-01

健康设置

总览

运行状况功能的设置在health.xml中描述。设置包括:
  • 卫生系统-卫生系统设置
  • 运行状况检查-设置以检查系统
  • 运行状况Action-执行任务的设置(服务器重新启动,获取堆转储,PDF报告输出等)
  • 健康状况-设置健康Action的执行条件
组合这些设置以确定在系统出现故障时要执行的任务。

health.xml

health.xml位于以下路径中。
  • Linux路径
    • 默认安装路径
    /etc/resin/health.xml
    • 指定安装路径时
    %RESIN_HOME%/ conf / health.xml
  • Windows路径

%RESIN_HOME%/ conf / health.xml

默认设定

为与健康设置相关的各种设置项目设置默认值。
下面介绍每种设置。

卫生系统

默认 ,卫生系统本身的设置描述如下。
<health:HealthSystem> <enabled> true </ enabled> <startup-delay> 15m </ startup-delay> <period> 5m </ period> <recheck-period> 30s </ recheck-period> <recheck-max> 5 </ recheck-max> <check-timeout> 5m </ check-timeout> </ health:HealthSystem>
  • 已启用-启用卫生系统
  • startup-delay-将从Resin启动到运行状况系统开始监视的延迟时间设置为15分钟
  • 期间-将运行状况检查监视间隔设置为5分钟
  • recheck-period-将监视间隔设置为30秒以在检测到错误时重新检查
  • recheck-max-重新检查次数设置为5
  • 检查超时-将健康检查超时设置为5分钟

健康检查

默认 ,运行状况检查设置如下。
  • <health:ConnectionPoolHealthCheck>-是否超过了数据库 连接池的最大数量?
  • <health:CpuHealthCheck> -CPU使用率异常高吗?
  • <health:HealthSystemHealthCheck>-健康系统是否正常运行
  • <health:HeartbeatHealthCheck>-如果群集心跳正常运行
  • <health:JvmDeadlockHealthCheck>-是否发生死锁
  • <health:MemoryPermGenHealthCheck> -JavaVM的PermGen区域正常(可用区域为1MB或更大)
  • <运行状况:MemoryTenuredHealthCheck> -JavaVM的租用区域正常(可用区域为1MB或更大)
  • <运行状况:TransactionHealthCheck>-如果提交失败

注解

<health:CpuHealthCheck>的默认设置未设置为返回健康状态“ CRITICAL”。
根据环境,根据需要设置临界阈值属性。

健康Action和健康状况

健康Action和健康状况的默认设置如下。
<健康:ActionSequence>
  <健康:IfHealthCritical 时间=“ 2m”/>

  <运行状况:FailSafeRestart 超时=“ 10m”/>
  <health:DumpJmx />
  <health:DumpThreads />
  <健康:ScoreboardReport />
  <health:DumpHeap />
  <健康:DumpHeap hprof =“真”
                   hprof-path =“ $ {resin.logDirectory} /heap.hprof”/>
  <运行状况:StartProfiler 活动时间=“ 2m” 等待=“真”/>
  <health:重新启动/>
</ health:ActionSequence>
此设置是在运行状况系统检测到Resin错误时,在收集各种信息之后重新启动Resin实例。
以下说明。
  1. 如果任何一项健康检查返回的健康状态为“严重”,并且该状态持续2分钟
  2. 在信息收集延迟的情况下,将强制重启后的等待时间设置为10分钟
  3. 生成JMX转储
  4. 生成Thread转储
  5. 生成计分板报告
  6. 生成堆转储
  7. 以hprof格式生成堆转储
  8. 启动事件探查器并生成服务器信息,持续2分钟
  9. 重新启动Resin实例

注解

<health:IfHealthCritical time =“ 2m” />衡量卫生系统执行的监视间隔时间。
首先,每5分钟执行一次监视,并且当检测到健康状态为“ CRITICAL”时,每30秒执行一次重新确认。
如果“ CRITICAL”持续2分钟,则树脂将重新启动。如果健康状态在中间不再是“ CRITICAL”,则不会重新启动。

注解

由于树脂的限制,配置文件不会输出到PDF报告中。
“在所选时间段内未生成CPU配置文件。”
另外, 默认会设置以下运行状况Action 。
<运行状况:重新启动>
  <健康:IfHealthFatal />
</ health:重新启动>
如果任何一项运行状况检查返回运行状况状态“ FATAL”,则此设置将重新启动Resin实例。
默认 ,以下运行状况检查返回“ FATAL”。
  • <health:HealthSystemHealthCheck>-如果健康系统本身处于异常状态
  • <health:JvmDeadlockHealthCheck>-当JavaVM检测到处于死锁状态的Thread