prometheus high cardinality ingestion trop lente

dupont-charles 30/09/2024
RÉSOLU

salut les sres on galère avec prometheus depuis quelques jours. l'ingestion est super lente et on a des trous dans les métriques. on pense que c'est de la high cardinality parce qu'on a plein de nouveaux labels dynamiques. y a une façon de débugger ça proprement sans tout casser ?

30/09/2024 à 15:10

5 commentaires

philippe-jeanne
Membre Actif
Avatar de philippe-jeanne
philippe-jeanne
Membre Actif

ouais la high cardinality c le cancer de prometheus. commence par le endpoint /tsdb_status de ton prometheus. ça va te donner les stats sur les séries actives et le nombre de chunks. cherche les labels qui ont le plus de valeurs uniques

01/10/2024 à 14:37
adrien-brun
Membre Actif Secouriste
Avatar de adrien-brun
adrien-brun
Membre Actif Secouriste

souvent c'est des labels genre request_id ou session_id qui n'ont rien à faire dans des métriques. faut utiliser relabel_configs dans ta config prometheus.yml pour les virer ou les normaliser avant ingestion

02/10/2024 à 11:50
suzanne-faivre
Membre Actif
Avatar de suzanne-faivre
suzanne-faivre
Membre Actif

exact relabel_configs c'est ton ami. tu peux utiliser un regex pour virer les labels indésirables ou les remplacer par une valeur générique. assure-toi de tester ça dans un env de staging avant. une erreur de regex peut couper toutes tes métriques

03/10/2024 à 07:00

ah ok je vois le truc. j'ai check /tsdb_status et en effet y a un label user_session_id qui explose tout. on l'a rajouté pour débugger un truc et on l'a oublié. je vais tenter de le virer avec un relabel_config. merci !

04/10/2024 à 05:49

bon c bon j'ai viré ce label de merde. l'ingestion est revenue à la normale. merci la team vous avez sauvé mon week-end

05/10/2024 à 03:07

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire