今天要跟大家介紹不是技術,但是蠻重要問題處理流程與紀錄功能,這也是 Zabbix 本身就有的功能~
目前行雲者還沒有導入這個機制,不過我們是用 Redmine 統一進行任務與問題追蹤,不過最主要的用意在於說,找出實際的問題,排除排除的做法都記錄下來,好讓下次面臨一樣的問題可以快速參考之前的解決方案。
這個功能 在Dashboard 就可以看到,主要的功能在 Monitoring -> Problems
點選 NO 可以進行問題的狀態更新 ~
Message : 可以記錄當下發生的況狀補充紀錄
Change severity : 也可以更改狀態的等級
Acknowledge : 我自己的想像是如果有人打勾表示這個問題有人接手在處理了
Close problem : 也可以手動解決掉問題啦,但是如果之是手動解決,實際沒解決,警報還是會繼續跳出喔 ~
如果真的沒影像想要關掉的話,點選該問題,選擇 Configuration
把 Enabled 打勾取消,更新就不會針對該機器進行這個項目的監控了~
這樣的動作如果有持續進行,累積一定的數據,相信可以加快處理問題的速度~
內容如有介紹不周的地方,再麻煩大家提點,感激不盡。
同步發表 2021鐵人賽 再麻煩大家多多指教 謝謝