7 commentaires
salut. l'oomkilled sur prometheus c'est souvent un signe que le nombre de series augmente trop vite. chaque nouvelle target même petite peut ajouter des milliers de series. t'as check le nombre de series actives dans prometheus lui-même ? métrique prometheus_tsdb_head_series
ah merde j'avais pas pensé aux labels dynamiques. on a des métriques qui ont des labels avec des uuid de requêtes. c'est ptete ça. pour les series actives on est à 2.5 millions maintenant. avant on était vers 1.8M
vous êtes des génies ! j'ai ajouté un relabel_config pour virer le label uuid_requete sur toutes les métriques et prometheus tourne comme un charme maintenant. la mémoire est stable. énorme thx
Laisser une réponse
Vous devez être connecté pour poster un message !
yo la team sres. j'ai un souci avec mon prometheus en k8s. on a ajouté une dizaine de nouveaux microservices à scraper et depuis prometheus se fait oomkilled régulièrement genre toutes les 2-3h. avant ça tournait nickel avec 200 targets. on a augmenté la memory limit à 4Go mais ça change rien