Posts tagged "prometheus"

November 18, 2022

Production Monitoring and Alerting with Prometheus and Grafana

Setting up comprehensive monitoring and alerting for production systems using Prometheus, Grafana, and Alertmanager.

November 30, 2021

Building a complete monitoring and alerting stack with Prometheus and Grafana for microservices architecture.

March 20, 2020

Fixed Prometheus high cardinality issue - reduced time series from 10M to 100K (99% reduction). Query performance improved 50x

July 15, 2019

Monitoring Istio service mesh - traffic metrics, distributed tracing, service dependencies, and debugging microservices with zero code changes

January 20, 2019

Building highly available Prometheus setup with Thanos - unlimited retention, global queries, and surviving datacenter failures

January 15, 2018

Configuring Alertmanager for production - routing rules, inhibition, silencing, and integrating with Slack and PagerDuty

October 12, 2017

How we set up Prometheus and Grafana for monitoring our microservices architecture.

February 14, 2017

Creating effective Grafana dashboards with Prometheus - from basic graphs to advanced alerting and team dashboards

April 20, 2016

Setting up Prometheus to monitor 5 microservices - metrics collection, alerting, and our first production incident caught by monitoring