
오픈마루
04778 서울시 성동구 뚝섬로1길 31 906 호
(성수동1가, 서울숲M타워)
Tel : 02-469-5426 | Fax : 02-469-7247
Email : sales@openmaru.io
소프트웨어 공학에서 관측 가능성(observability)은 프로그램의 실행 데이터와 내부 상태, 그리고 모듈 간 통신을 수집해 시스템을 이해하는 능력을 의미합니다. 원래 제어공학에서 시스템의 출력만으로 내부 상태를 추정할 수 있는 능력을 의미하는 용어를 가져온 것으로, 소프트웨어 환경에서는 수집된 텔레메트리(메트릭, 로그, 트레이스, 프로파일링)를 통해 시스템의 동작을 이해하고 문제를 해결하는 데 이용합니다.
관측 도구는 메트릭·로그·트레이스라는 세 가지 유형의 데이터를 중심으로 합니다. 메트릭은 요청 건수, 실패율, 데이터베이스 크기 등 특정 시점의 상태를 나타내는 숫자 지표입니다. 로그는 사람이 읽을 수 있는 텍스트로, 시간·심각도와 함께 이벤트의 세부 내용을 기록합니다. 트레이스는 한 사용자의 요청이 여러 서비스에서 처리되는 과정을 스팬(span)이라는 단위로 나누어 추적하여 서비스 간 인과 관계와 시간 관계를 보여줍니다. 세 데이터를 함께 분석함으로써 시스템의 상태를 유추하고, 재현되지 않는 장애도 빠르게 식별할 수 있습니다.
관측 가능성은 모니터링과는 다릅니다. 위키피디아에서는 모니터링과 관측 가능성을 구분하면서, 모니터링은 미리 정의된 텔레메트리로 정해진 지표만 보는 반면, 관측 도구는 탐색적 분석을 통해 시스템의 모든 상태를 이해하려 한다고 설명합니다. 단순한 대시보드나 임계치 기반 경고를 넘어, 알려지지 않은 문제를 스스로 탐지하고 근본 원인을 파악하는 데 중점을 둡니다.
오픈마루는 2000년대부터 기업용 웹서버와 애플리케이션 성능 관리(APM) 솔루션을 개발해 왔습니다. 컨테이너 환경이 확산되자 기존 모니터링 방식으로는 동적 IP와 다수의 마이크로서비스를 처리하기 어렵고, 장비별 로그를 모으는 데에도 한계가 있다는 것을 깨달았습니다. OPENMARU APM은 도커 컨테이너 환경에서 실행되는 WAS를 실시간으로 모니터링하고 장애를 분석하는 국내 첫 제품으로 자리매김했지만, 클라우드 네이티브 시대에는 메트릭·로그·트레이스가 분리된 도구들 때문에 원인 분석에 시간이 오래 걸리는 문제가 있었습니다.
또한 복잡한 MSA에서는 애플리케이션이 여러 컨테이너에 분산되어 있기 때문에 장애 원인을 빠르게 분석하는 것이 중요합니다.
“컨테이너 환경의 트러블슈팅은 실시간으로 장애를 감지하고 효율적으로 해결하는 방법”이며, 특히 복잡한 애플리케이션이 여러 컨테이너에서 실행되기 때문에 장애 발생 원인을 빠르게 분석하는 것이 중요합니다.
이러한 현실을 반영해 오픈마루는 APM에서 한 단계 더 나아간 Observability 플랫폼을 개발했습니다. 분산된 서비스의 메트릭·로그·트레이스를 한 곳에 통합하고 AI 기반 이상 탐지와 상관 분석으로 장애를 조기에 발견하며, 마이크로서비스 토폴로지 맵을 통해 시스템 구조를 직관적으로 보여주는 것을 목표로 했습니다.
1. 실시간 운영 인사이트 : OPENMARU Cloud APM은 모든 트랜잭션을 100% 실시간으로 모니터링해 장애 발생을 즉시 감지합니다. Observability는 이를 확장해 메트릭·로그·트레이스를 통합 분석하여 장애의 징후를 더욱 빨리 발견하고, 서비스 간 인과 관계를 시각화합니다. 이는 서비스 안정성과 사용자 경험을 크게 향상시킵니다.
2. 운영 비용 절감 : 오픈마루의 APM 고객들은 서버 문제를 정확히 파악함으로써 IT 운영 비용을 30% 이상 절감할 수 있다고 보고합니다. Observability는 데이터 수집과 분석을 자동화하고 AI 기반 예측으로 장애를 미리 방지하여 인력 투입과 장애로 인한 손실을 줄여 줍니다.
3. 컨테이너·쿠버네티스 지원 :OpenShift와 쿠버네티스 등 컨테이너 오케스트레이션 플랫폼에 최적화된 설계로, 동적으로 변하는 IP 환경이나 멀티클러스터 환경에서도 안정적으로 작동합니다.
4. 지속적인 성능 최적화와 문제 진단 : OPENMARU APM은 성능 최적화를 위한 실제 문제 해결에 중점을 둔다고 강조합니다. Observability는 AI가 이상 징후를 자동으로 탐지하고 루트 원인을 제시하여 개발·운영팀이 병목을 신속하게 제거할 수 있게 도와줍니다.
5. 확장성과 개방성 : 오픈마루는 오픈소스 커뮤니티를 적극 활용하며, OpenTelemetry와 같은 표준을 지원하는 통합 에이전트를 제공해 다양한 언어와 프레임워크에서 데이터를 수집할 수 있도록 합니다. 또한 SaaS 방식과 온프레미스 방식 모두 제공해 다양한 기업 환경에 맞출 수 있습니다.
시장에는 많은 관측 도구가 있지만, 많은 솔루션이 특정 클라우드 서비스나 데이터 타입에 국한되어 있거나, 문제를 단순 모니터링 수준에서 파악합니다. OPENMARU Observability는 다음과 같은 특징으로 차별화됩니다.
Observability는 단순히 로그와 그래프를 모아 보는 수준을 넘어, 시스템의 모든 상태를 탐색적으로 이해하는 능력을 의미합니다. MSA와 쿠버네티스 환경에서 수많은 마이크로서비스가 협력하는 오늘날, 기업은 장애를 미리 감지하고 사용자 경험을 보호할 수 있는 관측 플랫폼이 필요합니다. OPENMARU Observability는 기존 APM에서 한 발 더 나아가, 메트릭·로그·트레이스를 통합한 AI 기반 분석, 컨테이너 최적화, 실시간 성능 최적화, 토폴로지 시각화를 제공함으로써 국내 기업의 클라우드 네이티브 전환을 지원합니다.
복잡한 시스템에서 발생하는 문제를 감지하고 해결하는 일은 여전히 사람의 경험과 지식이 필요하지만, 관측 도구는 그 과정을 크게 단축시키고 안정적인 운영을 가능하게 합니다. OPENMARU Observability는 고객이 서비스 혁신에 집중할 수 있도록 신뢰할 수 있는 운영 인사이트를 제공합니다