了解zabbix,有必要了聊一下監(jiān)控系統(tǒng)相關內容 企業(yè)中常用的開源監(jiān)視系統(tǒng)目前有 cacti、Nagios、Open-Falcon、zabbix、prometheus等 使用監(jiān)控系統(tǒng)的目的在于/1、能夠及時發(fā)現(xiàn)故障、及時處理、降低損失 /2、另一方面降低運維人員的工作量 /3、監(jiān)控對象幾乎涵蓋所有服務程序 { 服務器的硬件:CPU使用率 / 負載、內存使用率 / 空閑情況、磁盤使用情況等 服務器性能:帶寬 IO、磁盤 IO、進程等 網(wǎng)絡服務:不同服務的運行情況等 當前業(yè)務:訪問量、發(fā)貨狀態(tài)、成交量、正在支付的用戶量等 網(wǎng)絡設備,及應用程序等 } 為什么需要對各類系統(tǒng)進行監(jiān)控?在系統(tǒng)構建時,通常不允許未被監(jiān)控的系統(tǒng)或應用上線,因為未被監(jiān)控的系統(tǒng)存在不可預知性,故障未知性等不穩(wěn)定因素,且無法及時被發(fā)現(xiàn)并排除。這對整個架構或系統(tǒng)都是很大的風險隱患,所以原則上需要對整個架構或系統(tǒng)進行監(jiān)控,隨時監(jiān)測各方面指標正常與否,提高系統(tǒng)穩(wěn)定性。 一個完整的監(jiān)控系統(tǒng)包括:· 數(shù)據(jù)采樣 :周期性的獲取某個被監(jiān)測指標的相關數(shù)據(jù) · 數(shù)據(jù)存儲 :將采集的數(shù)據(jù)存儲在指定的存儲系統(tǒng),zabbix默認是MySQL · 數(shù)據(jù)展示 :直觀的展示在用戶面前,可將采集的數(shù)據(jù)做二次處理,做成各類圖形 · 報警 :當監(jiān)控指標出現(xiàn)異常時需要實時發(fā)出告警信息,必要情況可自行修復等 Zabbix基于WEB界面的提供分布式系統(tǒng)監(jiān)視以及網(wǎng)絡監(jiān)視功能的企業(yè)級的開源解決方案,目前大部分企業(yè)公司均有使用 官方手冊https://www./documentation/4.0/zh/manual……支持中文版 相關特性zabbix 是一個高度集成的網(wǎng)絡監(jiān)控套件,通過一個軟件包就可提供諸多特性 /1、數(shù)據(jù)收集 :通過 snmp 、ssh 、telnet 、agent 、ipmi 、jmx 、等通道采集被監(jiān)控數(shù)據(jù)的數(shù)據(jù)。詳情點擊 /2、實時繪圖:展示,讀取數(shù)據(jù)繪圖,支持 graph 、map 、screen 、slide show /3、告警:郵件,短息,微信,釘釘?shù)韧ㄓ嵻浖?/span> /4、數(shù)據(jù)存儲:mysql 、pgsql 、時間序列數(shù)據(jù)庫 /5、靈活閾值定義:zabbix中稱為觸發(fā)器 trigger /6、配置簡單:一次配置,終生監(jiān)控 /7、網(wǎng)絡自動發(fā)現(xiàn):自動發(fā)現(xiàn)網(wǎng)絡設備,agent 自動注冊 /8、WEB 接口:使用PHP編寫,訪問快速無障礙 /9、二進制守護進程:高性能,低內存消耗,易移植 等 常用組件· Server 服務端,數(shù)據(jù)集成地 · Agent 客戶端,收集數(shù)據(jù) · Proxy 代理,相當于中轉站,需要把收集到的數(shù)據(jù)提交 / 被提交到 Server · Database 數(shù)據(jù)存儲,配置信息及采集的數(shù)據(jù) · Web GUI 提供的WEB界面 工作原理zabbix agent需要安裝到被監(jiān)控的主機上,它負責定期收集各項數(shù)據(jù),并發(fā)送到zabbix server端; zabbix server將數(shù)據(jù)存儲到數(shù)據(jù)庫中,zabbix web根據(jù)數(shù)據(jù)在前端進行展現(xiàn)和繪圖。 這里agent收集數(shù)據(jù)分為主動和被動兩種模式: 主、agent請求server獲取主動的監(jiān)控項列表,并主動將監(jiān)控項內需要檢測的數(shù)據(jù)提交給server/proxy 被、server向agent請求獲取監(jiān)控項的數(shù)據(jù),agent返回數(shù)據(jù) 工作進程· zabbix_get 單獨使用命令,用來故障排錯 · zabbix_sender 發(fā)送數(shù)據(jù)給server或proxy,用于耗時較長的檢查 · zabbix_java_gateway 2.0后引入,Java 網(wǎng)關,主動的獲取數(shù)據(jù) · zabbix_agentd 客戶端守護進程 · zabbix_proxy 代理守護進程 · zabbix_server 服務端守護進程 相關概念
host · 主機 要監(jiān)控的網(wǎng)絡設備,可由IP或DNS名稱指定 host group · 主機組 主機的邏輯容器,可以包含主機和模板,但同一個組織內的主機和模板不能互相鏈接 item · 監(jiān)控項 一個特定監(jiān)控指標的相關的數(shù)據(jù);item是zabbix進行數(shù)據(jù)收集的核心,相對某個監(jiān)控對象,每個item都由"key"標識; trigger · 觸發(fā)器 一個表達式,用于評估某監(jiān)控對象的特定item內接收到的數(shù)據(jù)是否在合理范圍內,也就是閾值 event · 事件 觸發(fā)一個值得關注的事情,比如觸發(fā)器狀態(tài)轉變,新的agent或重新上線的agent的自動注冊等 action · 動作 指對于特定事件事先定義的處理方法,如發(fā)送通知,何時執(zhí)行操作 escalation · 報警升級 發(fā)送警報或者執(zhí)行遠程命令的自定義方案 media · 媒介 發(fā)送通知的手段或者通道,如Email、Jabber或者SMS等 notification · 通知 通過選定的媒介向用戶發(fā)送的有關某事件的信息 template · 模版 用于快速定義被監(jiān)控主機的預設條目集合,通常包含了item、trigger、graph、等,模板可以直接鏈接至某個主機 application · 應用 一組item的集合 web scennario · web場景 用于檢測web站點可用性的一個或多個HTTP請求 frontend · 前端 Zabbix的web接口 監(jiān)控架構
根據(jù)網(wǎng)絡環(huán)境、監(jiān)控規(guī)模等,分以下三種架構 /1、server-client 直接由zabbix server和zabbix agentd之間進行數(shù)據(jù)交互,適用于網(wǎng)絡比較簡單,設備比較少的監(jiān)控環(huán)境
/2、server-proxy-client server+proxy+agentd建立,一般適用于跨機房、跨網(wǎng)絡的中型網(wǎng)絡架構的監(jiān)控
/3、master-node-client 每個node同時也是一個server端,node下面可以接proxy,也可以直接接client 。node有自已的配置文件和數(shù)據(jù)庫,將配置信息和監(jiān)控數(shù)據(jù)向master同步 適用于跨網(wǎng)絡、跨機房、設備較多的大型環(huán)境
|
|