現在運維監控工具非常多,哪個好,哪個不好,哪個適合你,哪個不適合你,其實只有你了解了他們的特性后,才知道,接下來咱們從這里開始講常見的運維資源監控工具。
一. 常見的運維監控工具
現在運維監控工具非常多,哪個好,哪個不好,哪個適合你,哪個不適合你,其實只有你了解了他們的特性后,才知道,所以從這里開始講起。
1. Cacti
Cacti是一套基于PHP,MySQL,SNMP及RRDTool開發的網絡流量監測圖形分析工具。
簡單的說Cacti就是一個PHP程序。它通過使用SNMP協議獲取遠端網絡設備和相關信息,(其實就是使用Net-SNMP 軟件包的snmpget 和snmpwalk 命令獲取)并通過RRDTOOL工具繪圖,通過PHP程序展現出來。我們使用它可以展現出監控對象一段時間內的狀態或者性能趨勢圖。
Cacti是很老的一款監控工具了,其實說它是一款流量監控工具更合適,對流量監控比較精準,但缺點很多,出圖不好看,不支持分布式,也沒有告警功能,所以使用的人會越來越少。
2. Zabbix
Zabbix是一個基于WEB界面的提供分布式系統監視以及網絡監視功能的企業級的開源解決方案。zabbix能監視各種網絡參數,保證服務器系統的安全運營;并提供強大的通知機制以讓系統運維人員快速定位/解決存在的各種問題。
Zabbix由2部分構成,zabbix server與可選組件zabbix agent。zabbix server可以通過SNMP,zabbix agent,ping,端口監視等方法提供對遠程服務器/網絡狀態的監視,數據收集等功能,它可以運行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等平臺上。
Zabbix解決了cacti沒有告警的不足,也解決了nagios不能通過web配置的缺點,同時還支持分布式部署,這使得它迅速流行起來,zabbix也成為目前中小企業監控最流行的運維監控平臺。
3. Prometheus
Prometheus是一套開源的系統監控報警框架,它既適用于面向服務器等硬件指標的監控,也適用于高動態的面向服務架構的監控。
4. Nagios
Nagios是一款開源的免費網絡監視工具,能有效監控Windows、Linux和Unix的主機狀態,交換機路由器等網絡設置,打印機等。在系統或服務狀態異常時發出郵件或短信報警第一時間通知網站運維人員,在狀態恢復后發出正常的郵件或短信通知。
Nagios主要的特征是監控告警,最強大的就是告警功能,可支持多種告警方式,但缺點是沒有強大的數據收集機制,并且數據出圖也很簡陋,當監控的主機越來越多時,添加主機也非常麻煩,配置文件都是基于文本配置的,不支持web方式管理和配置,這樣很容易出錯,不宜維護。
5. Ganglia
Ganglia是一款為HPC(高性能計算)集群而設計的可擴展的分布式監控系統,它可以監視和顯示集群中的節點的各種狀態信息,它由運行在各個節點上的gmond守護進程來采集CPU 、內存、硬盤利用率、I/O負載、網絡流量情況等方面的數據,然后匯總到gmetad守護進程下,使用rrdtool存儲數據,最后將歷史數據以曲線方式通過PHP頁面呈現。
Ganglia監控系統有三部分組成,分別是gmond、gmetad、webfrontend。gmond安裝在需要收集數據的客戶端,gmetad是服務端,webfrontend是一個php的web ui界面,ganglia通過gmond收集數據,然后在webfrontend進行展示。
Ganglia的主要特征是收集數據,并集中展示數據,這是ganglia的優勢和特色,ganglia可以將所有數據匯總到一個界面集中展示,并且支持多種數據接口,可以很方便的擴展監控,同時,最為重要的是,ganglia收集數據非常輕量級,客戶端的gmond程序基本不耗費系統資源,而這個特點剛好彌補了zabbix消耗性能的不足。
最后,Ganglia在對大數據平臺的監控更為智能,只需要一個配置文件,即可開通Ganglia對hadoop、spark的監控,監控指標有近千個,完全滿足了對大數據平臺的監控需求。
對于現在流行的微服務,Prometheus的多維度數據收集和數據篩選查詢語言也是非常的強大。Prometheus是為服務的可靠性而設計的,當服務出現故障時,它可以使你快速定位和診斷問題。
6. Grafana
Grafana是一個開源的度量分析與可視化套件,通俗的說,Grafana就是一個圖形可視化展示平臺,它通過各種炫酷的界面效果展示我們的監控數據,如果你覺得zabbix的出圖界面不夠好看,逼格不夠高,就可以使用Grafana的可視化展示,同時,Grafana支持許多不同的數據源,Graphite,InfluxDB,OpenTSDB,Prometheus,Elasticsearch,CloudWatch和KairosDB都可以完美支持。
文章推薦:合肥自動化運維是什么?