prometheus high memory usage out of memory

Question

Mon instance Prometheus explose en RAM depuis ce matin et finit en OOMKilled toutes les heures. J'ai pourtant pas ajouté tant de targets que ça.
Vous avez une astuce pour identifier quel job bouffe tout avant que le container crash ?

paulette40 · Answer

C'est probablement une explosion de cardinalité sur certaines metrics. Tu peux interroger l'API de Prometheus pour voir quels labels ou noms de metrics sont les plus lourds dans ton TSDB.
promtool tsdb analyze /prometheus

jeannine19 · Answer

Regarde aussi si t'as pas des devs qui ont push des metrics avec des ID d'utilisateurs ou des timestamps en labels. Ça tue le scheduler et sature la mémoire direct. Tu peux aussi limiter le nombre de samples par target dans ta config.
scrape_configs:
  - job_name: 'my-app'
    sample_limit: 10000

delorme-adrien · Answer

Le promtool tsdb analyze a sauvé ma journée. C'était une metric custom qui enregistrait l'email des clients en label... J'ai viré ça et la RAM est redevenue stable. Merci !
Je vais aussi ajouter le sample limit pour éviter que ça recommence.

prometheus high memory usage out of memory

3 commentaires

Laisser une réponse

Les pointeurs dans le langage de programmation Go

Comprendre, Gérer et Manipuler un cluster Docker Swarm

Gérer et manipuler les namespaces et les ResourceQuotas

L'Ère des Microservices Autonomes : Vers des Systèmes Self-Healing

Pourquoi vos applications 10x plus rapides sont bridées par la RAM

Rejoindre la communauté