prometheus high memory usage out of memory

delorme-adrien 29/04/2026
RÉSOLU

Mon instance Prometheus explose en RAM depuis ce matin et finit en OOMKilled toutes les heures. J'ai pourtant pas ajouté tant de targets que ça.

Vous avez une astuce pour identifier quel job bouffe tout avant que le container crash ?

29/04/2026 à 16:14

3 commentaires

paulette40
Membre Actif
Avatar de paulette40
paulette40
Membre Actif

C'est probablement une explosion de cardinalité sur certaines metrics. Tu peux interroger l'API de Prometheus pour voir quels labels ou noms de metrics sont les plus lourds dans ton TSDB.

promtool tsdb analyze /prometheus
02/05/2026 à 15:18
jeannine19
Membre
Avatar de jeannine19
jeannine19
Membre

Regarde aussi si t'as pas des devs qui ont push des metrics avec des ID d'utilisateurs ou des timestamps en labels. Ça tue le scheduler et sature la mémoire direct. Tu peux aussi limiter le nombre de samples par target dans ta config.

scrape_configs:
  - job_name: 'my-app'
    sample_limit: 10000
04/05/2026 à 18:16

Le promtool tsdb analyze a sauvé ma journée. C'était une metric custom qui enregistrait l'email des clients en label... J'ai viré ça et la RAM est redevenue stable. Merci !

Je vais aussi ajouter le sample limit pour éviter que ça recommence.

Modifié le 23/05/2026 à 16:20

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire