top of page

DevOps LGTM 스택 도입기


핀다_개발문화

안녕하세요. 핀다 DevOps 팀의 김명석입니다.


이번 글에서는 저희 팀에서 Observability 도구로써 LGTM 스택을 채택하고 적용한 경험에 대해 이야기해보고자 합니다.


 

step 1. LGTM이란?

LGTM 에 대한 소개는 ChatGPT 에게 맡기겠습니다.


Q) “Grafana LGTM 에 대해 설명해줘”

A) LGTM은 혁신적인 데브옵스의 관찰 가능성(Observability) 기술 스택으로, Loki, Grafana, Mimir, 그리고 Tempo의 각 첫 글자를 따서 이름이 지어졌습니다. 이 도구들은 시스템 모니터링, 로그 관리, 대시보드 제공, 그리고 분산 추적을 위해 함께 사용되며, 서비스의 성능과 안정성을 확보하는 데 굉장히 중요합니다. LGTM 스택은 효과적인 데브옵스 프로세스를 구축하려는 모든 기업에게 놀라운 가치를 제공하며, 이를 통해 기술 팀이 서비스의 상태를 실시간으로 파악하고 문제를 신속하게 해결할 수 있습니다.

우리는 어떤 문제를 해결하고자 하였는가?

핀다의 서비스는 AWS EKS 위에서 MSA 구조로 되어 있는데요. 핀다가 성장하면서 서비스의 수도 꾸준히 증가하여 현재는 수십여개의 서비스로 운영중입니다. (이 성장세라면 곧 백여로 늘어날 것 같네요!)


서비스의 개수가 증가할수록 서비스들 간의 통신 구조는 점점 복잡해지고, 애플리케이션에서 문제가 발생했을때 문제가 되는 지점을 찾는 것이 점점 어려워졌습니다. 서비스 개수가 늘어날수록 트러블슈팅에 더 많은 시간이 소요될 것이라는것이 자명했죠.


이번 글의 결론이라고도 할 수 있겠는데요. LGTM 스택을 적용하고 아래와 같이 서비스 토폴로지(구성도)와 RED(Rate, Error, Duration) 지표를 통해 전체적인 서비스의 현재 상태 파악이 가능해졌고, 문제가 발생했을 때 더욱 빠르게 원인을 찾고 해결할 수 있게 되었습니다.





bottom of page