Prometheus - Trop de cardinalité sur les métriques - besoin de débugger

Question

yo la team ! notre instance Prometheus explose en ram et cpu depuis quelques jours. après analyse rapide on a des métriques avec une cardinalité de ouf mais j'arrive pas à spotter lesquelles. j'ai déjà viré quelques labels inutiles mais ça suffit pas. comment je peux débugger ça plus finement ?

dubois-emilie · Answer

salut ! utilise les outils intégrés à Prometheus. va sur /tsdb-status/ dans l'UI. tu peux y voir les métriques qui ont le plus de series et les labels qui contribuent le plus à la cardinalité. ça te donnera des pistes directes

nblanc · Answer

ah cool j'avais pas vu cette page ! je regarde ça. merci !

odette-guillet · Answer

attention aussi aux relabel_configs. une erreur là-dedans peut générer une cardinalité monstrueuse si tu transformes des valeurs uniques en labels sans y faire gaffe. pense à faire des tests avec promtool debug metrics avant de pousser en prod

nblanc · Answer

bon j'ai trouvé le coupable : une métrique custom de notre app qui exporte un label genre user_id_session pour chaque requête. évidemment y'a des millions de valeurs uniques. je dois refaire la métrique sans ce label. c'est bon je gère. thx encore

Prometheus - Trop de cardinalité sur les métriques - besoin de débugger

4 commentaires

Laisser une réponse

Les variables dans le langage de programmation Go

Event à la Dockercon Europe 2018

L'Ère des Pipelines Intelligents: GenAI Révolutionne le Platform Engineering

L'Ère des Environnements DevOps Neuro-Adaptatifs : L'IA au Service de l'Expérience Humaine

Surpassez vos limites : Optimisez le monitoring réseau avec eBPF

Rejoindre la communauté