
有一種訊息比 bug 還可怕。
不是報錯訊息,也不是主機爆 RAM。
而是客戶傳來一句:
「欸,網站是不是壞掉了?」
看到這句話的瞬間,基本上心裡都會出現三個想法:
是不是客戶端的問題(很常遇到...)
壞多久了?
客戶是不是已經試了好幾次…
這件事發生幾次之後,我決定
我要成為第一個知道網站掛掉的人。
於是,我開始認真研究網站監控。
其實也用了好幾年換了好幾種...
一開始,其實我也用過 UptimeRobot
老實說,UptimeRobot 真的不錯。
免費版就有:
APP 通知
操作簡單
穩定
幾乎不用學習成本
問題只有一個。
5 分鐘才檢查一次。
聽起來很短對吧?
但實際上是:
第 1 分鐘網站掛掉
第 4 分鐘客戶打開網站
第 4 分 30 秒客戶傳 LINE 給你
第 5 分鐘你才收到監控通知
……氣氛直接變得很微妙。
升級付費當然可以縮短時間,但當監控網站數量開始增加後,費用就沒有那麼可愛了,而且有些我想要的功能,其實付費後也還是做不到。
後來我試了 UptimeFlare(理論很美好)
UptimeFlare 部署在 Cloudflare 上,看起來超香:
免費
每分鐘監控
介面乾淨
聽起來幾乎完美
結果實際使用後開始出現靈異事件:
有時候狀態沒更新
有時候網站明明正常卻狂報錯
有時候又安靜到讓人懷疑它是不是睡著了
監控工具最怕的不是壞掉。
而是你不知道它講的話能不能相信。
通知開始變成狼來了之後,我就決定換方案。
最後,我選擇自己架:Uptime Kuma
某天我看到 Uptime Kuma,第一個想法是:
「欸,這 UI 也太好看了吧?」
(沒錯,我承認我有一半是因為介面。)
但真正吸引我的,是它可以 自己部署。
意思就是:
想多久檢查一次 → 自己決定
想監控幾個網站 → 自己決定
想怎麼通知 → 自己串
監控主導權直接拿回來。
我的部署方式(其實很輕量)
我把 Uptime Kuma 架在自己的 Compute Engine 上:
1 核 CPU
2GB RAM
Docker 部署
目前監控:
8 台主機
64 個網站
每分鐘檢查一次
跑了幾天後我去看資源使用率。
結果 CPU 幾乎在散步,RAM 也很冷靜。
比我想像中省資源非常多。
Uptime Kuma 好玩的地方(不只是看網站活著)
很多人以為監控只是:
「網站能不能打開?」
但 Kuma 可以玩得更細。
🔎 不只 HTTP 檢查
它可以監控:
HTTP / HTTPS
Ping
TCP Port
DNS
Docker 容器
關鍵字檢查
例如我可以設定:
👉 網站必須包含「登入成功」文字才算正常。
這就不是「網站活著」,而是「網站真的能用」。
🔔 通知整合超多
支援的通知方式多到有點誇張:
Telegram
LINE Notify
Discord
Email
Webhook
我現在幾乎是網站一出問題,手機幾秒內就震動。
(有時候快到讓我懷疑是不是我自己弄壞的。)
📊 自帶服務狀態頁
它可以直接生成一個公開狀態頁。
客戶如果問:
「最近穩不穩?」
直接丟連結就好。
不用解釋,不用截圖。
數據自己說話。
最大的改變:工作模式完全不同
以前:
客戶發現 → 通知我 → 我開始查
現在:
Kuma 通知 → 我修好 → 客戶沒發現
差別看起來很小,但信任感差非常多。
客戶會覺得:
「好像一直有人在顧系統。」
(雖然其實是機器在顧。)
為什麼我覺得接案工程師都該有監控
當網站超過一定數量後,人類不可能靠手動巡站。
監控系統其實是:
你的分身
你的值班工程師
半夜不睡覺的員工(而且不用太多薪水)
而 Uptime Kuma 剛好提供一個:
低成本、好上手、又足夠專業的解法。
結論
以前我最怕的是客戶告訴我網站壞掉。
現在我最常做的事情是:
先修好,再跟客戶說:
「剛剛主機有點異常,我已經處理好了 👍」
老實說,這種感覺滿爽的。
因為當問題還沒被看見就被解決時,
工程師的價值才真正出現。

0 意見