태그 보관물: 자빅스

zabbix flexible interval

20일만의 포스팅! ㅋㅋㅋㅋ

load

최근 “특정 노드”에 “특정시간”에 부하가 치솟는 패턴이 보여지고 있다.

정상적인 패턴이라 판단되었으나, 기본 트리거가 load average 10으로 걸려 있어서…. 저 시간만 되면 문자가 날아온다..

하루이틀이라면 버텼겠지만.. 매일 저런다면… 문자 폭탄땜에 짜증이 날 지경이다..

해당 시간에 알람을 끌려고 하는데, 이때 사용하는게 flexible interval이다.

한국어버전에서는 “유동적인 갱신 간격“으로 변경되어 있다.

암튼 아래 표를 보면 cpu load5의 평소 갱신 간격은 20초마다 체크하게 되어 있고, 실제 latest data값도 20초간격인 것을 알 수 있다.

flexible interval을 이용하면 이 시간에만 갱신 간격을 조정할 수 있다.

다시 아래 표를 보면 09:59 ~ 10:01까지 1분 간격으로 값을 수집하는 것을 알 수 있다.

평소 09:59 ~ 10:01
기본 갱신 간격 20초 유동적인 갱신간격 60초
28 Apr 2015 09:58:16 28 Apr 2015 09:59:16
28 Apr 2015 09:58:36 28 Apr 2015 10:00:15
28 Apr 2015 09:58:55 28 Apr 2015 10:01:15

이 갱신 간격값을 0으로 조정할 경우 해당 시간대에는 아예 수집을 하지 않게 된다.

아래 시간처럼 알람이 울리는 시간에 flexible interval을 적용한다.

load2

 

이제 지긋지긋한 알람 안뇨옹~~~~~~~~

그런데 저렇게 해놓으면 해당 시간대에 아예 모니터링이 안되므로 찝찝할 수가 있다.

그럴 경우 트리거를 여러개 만들어서 조정하면 되는데…

이건 귀찮으니 다음에 정리해야지 -_-;;;;;;

zabbix trigger 관련 내용

1. 보통 zabbix 서버에서 알람이 1회 울리고, 그 이후에는 해제될 때까지 알람이 울리지 않는다.

그런데 trigger설정에서 Event generation <- 이부분을 Multiple Problem Events 로 해놓으면, 장애가 해제 될 때까지 주구장창 울리게 할수 있다..

 

예전에 이걸 몰라서 스크립트를 만들고 별짓을 다했는데… 참 한심하군… ㅠㅠ

zabbix_last_value

 

2. 두번째로 알람이 발생할 때 “ceph error” 이런식의 단순한 내용이 아니라, 실제 장애 내용을 파악하기 위해 출력값을 text로 조정하고, 이 VALUE를 트리거 제목으로 설정할 수가 있다.

zabbix 자체적으로 제공하는 매크로를 사용하면 되는데, {ITEM.LASTVALUE} <- 이 매크로를 사용하면 된다.

 

하루종일 뻘짓하긴 했지만, 그래도 의미있는 내용을 배울 수 있었다 -_-;