close

我的兄弟他希望能了解旗下各點的網路狀況;


說的仔細些,他希望能了解各點File Server , Mail Server , NAS Server , ERP 的運作狀態


Server 內部的 HDD 有否問題, CPU 是否過熱,FireWall 的狀況及流量管制,機房的溫度;


當異常發生時,除了 Mail 通知外,還能支援  SMS .


當然 最好是監控軟體及OS 最好是免費的.


我問他 unix 熟嗎? 他說可以.


因此我建議他可以試試 OpenNMS 或 Nagios


早年我在內湖一家公司當差,當時我就使用 Nagios 幫我管理機房及user 端設備大小事;


當Nagios 偵測到 被管理的系統 "快"異常時
我除了收到 Email 外, 我的 HP 6828RW 也會收到 Nagios 的 簡訊 通知


當年在內湖工作的地方 機房的溫度控制不是很理想
每當週末 我進行維護作業的時候 那溫度真的很嚇人


獨立冷氣常會自己 SHUTDOWN..當然主機群們也就跟著進入夢鄉了...
我一直很懷疑是獨立冷氣出了問題.


因此我自費購買 MCU 寫個 CODE來幫我監控機房的溫度
如果 溫度 OT , 希望我可以收到 ALARM.


剛完成的那個週末,我才准備前往公司進行維護 ,竟然收到 Nagios 的OT 警示...
跑到機房一看 不得了 冷氣漏水就像瀑布一般,而小瀑布就直接流入市電插座.


現場觀測才了解 原來是獨立冷氣的戶外機散熱故障,冷熱交換的結果 不是結冰 就是成水.....
通告  CEO 後,我趕緊 SHUTDOWN Server 群..


還好發現的早,否則後果 真的不堪設想.


除此之外,Nagios 還可以 監控 user 的網路行為.
我就常用它來了解哪個 user 老是在上班時段 上網賞車.
很讚的系統.


有一陣子我必須陪著孩子去醫院,無法常在  office,
這套系統真的幫我很多忙.


我把這個小故事 說給我兄弟聽,
讓他了解慎選警示系統的重要性.



arrow
arrow
    全站熱搜

    bv2jd 發表在 痞客邦 留言(0) 人氣()