Better Uptime! - 더 나은 On-call을 위하여

October 08, 2023

better-uptime.png

서비스가 제대로 돌고 있는지 확인하는 방법은 여러 가지가 있다. DataDog 같은 모니터링 서비스들은 왠만하면 다 알림 기능을 제공하고 있고, 보통 슬랙 / 이메일 등으로 알람이 온다.

하지만 단순 알람만으로는 부족하다고 느껴질 때가 있다. 다들 자고 있는데 서버가 터지면? 회사 슬랙이나 이메일만으로는 대응하기 매우 어렵다. 그래서 서비스가 장애났을 때 전화를 걸어주는 서비스가 있는지 찾아보았다.

AWS Incident Manager

AWS CloudWatch 또는 Eventbridge에서 문제가 발생했을 때, Incident Manager를 통해 자동으로 대응할 수 있다. 전화번호를 등록하면 전화도 받을 수 있다.

다만, 처음 세팅하는 과정이 복잡해서 번거롭고, AWS 의존적이라는 단점이 존재한다. 원래 AWS를 사용하고 있어서 AWS 의존적이라는 건 큰 문제가 되지 않았으나, 처음 만져보니 감이 잘 안 잡혀서 작업하다 열심히 헤매던 도중, 새 서비스를 사용하기로 했다.

Better Uptime

이번에 찾은 서비스는 Better Stack이란 회사에서 제공하는 Better Uptime이라는 서비스이다. Better Stack은 2021년에 창업한 신생 회사인데, 22년 7월 경 $18.6M 시리즈A 투자를 받았다(부럽다). DataDog 대항마 느낌으로 푸시를 받고 있는 듯 하다.

Better Uptime은 서비스가 제대로 작동 중인지 모니터링 할 수 있는 서비스이다. 모니터링할 URL을 넣어주면 끝. 아주 간단하게 사용할 수 있다.

그리고 모니터링 하는 서비스에 이상이 생기면 알람을 해 주는데, 이 때 전화 / SMS / Email / 앱 noti 중에서 어떤 걸로 보내줄 지 고를 수 있다. 그렇다. 국제전화로 알람을 받을 수 있다! 프로필에 전화번호 등록을 해 놓으면 간단하게 받을 수 있다. 다른 On-call 서비스처럼 스케줄링 등의 서비스도 당연히 지원한다. 간단하게 모니터링 서비스를 붙이고 싶을 때 꽤나 괜찮은 도구라고 생각한다. 스타트업에서 사용하기 딱 좋은 서비스인듯.

Reference

https://aws.amazon.com/ko/about-aws/whats-new/2021/05/introducing-incident-manager-aws-systems-manager/

https://betterstack.com/press/series-a/


Profile picture

Written by Mingyu Kim who works as a front-end engineer.