Hi 大家今天介紹 Dashboard 的功能,30 天到現在還沒有大家介紹說到底是否有警報。
對於這個警報畫面大家應該都再熟悉不過了,基本上只要登入就會進到這一頁。對於預設的畫面,還蠻適合當監控室的,目前是還在伺服器管理研究小組管理使用,之後畢竟服務是提供給開發人員,所以會希望開發人員也能知道自己使用的主機狀況,達到彼此交流。最後希望在行雲者研發基地的螢幕上這麼畫面,只要經過的人都可以看一下有甚麼問題。
首先就是有基本的傳統時鐘。
這框框就會代表 整個 Zabbix 運作的總狀態~
-
Zabbix server is running : 補充說明 Web 介面與 Zabbix Server 是可以拆開的唷,所以如果不想用Web 介面可以不用安裝,Zabbix 有出 API,所以如果要介接第三方WEB介面做整合也不是太困難唷,比較常聽到的是 Grafana。
-
Number of templates 、 Number of hosts (enabled/disabled) : 可以看出我們有多少樣板可以用,多少主機監控中。
-
Number of items (enabled/disabled/not supported) : 總共監控多少項目(分成 啟動中/關閉的/不支援)。
-
Number of triggers (enabled/disabled [problem/ok]) : 觸發器顧名思義就是超過限制的設定值會跳警報統計。
-
Number of users (online) : 幾位使用者正在線上。
-
Required server performance, new values per second : 數值更新的頻率。
- Host availability (上) 統計主機狀態 Available :表示已連上線數量,Not available :表示曾經連上線目前斷線數量,Unknown :表示還沒有連上線過。
- Problems by severity (下) 會依據問題的嚴重程度分類統計。
這個統計圖阿,我們目前運行 Zabbix 版本4.0沒有的(很久沒更新了 XD),這算是這次鐵人賽新發現~
這裡就會出現到底是那些有問題啦~
就會先是跳出警報的時間,是哪一台機器,發生什麼問題,持續多久,就會一覽無疑。如果已經解決的就會自己消失。這些警報都是套上樣板後就會幫我們設定好了,就樣就省下很多功夫。
就可以依據這些項目去排查問題了。至於有沒有問題就要自己判斷喔。像是 Zabbix server Apache: Process is not running 問題,因為我可以正常使用阿,那為什麼會跳錯,說不定是誤判或是沒設定好都是有可能的~
內容如有介紹不周的地方,再麻煩大家提點,感激不盡。
同步發表 2021鐵人賽 再麻煩大家多多指教 謝謝