Sujet :
RÉSOLU
Liste des sujets Répondre Créer un sujet
Membre depuis le 10/05/2024
salut les sres j'ai un souci avec mes alertes prometheus sur le cpu load. quand un serveur commence à morfler je reçois l'alerte genre 5-10min après que le load soit monté. je voudrais un truc plus réactif genre max 1-2min. vous avez des tips pour optimiser ça
# extrait de ma rule prometheus
- alert: HighCPULoad
expr: node_load1 > 8
for: 5m
labels:
severity: critical
annotations:
summary: "CPU load est trop élevé sur {{ $labels.instance }}"
vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
delmas-zoe
Membre depuis le 26/11/2024
ta config for 5m c'est trop long c'est ça qui retarde l'alerte essaie de le baisser à 1m ou même 30s si t'es sur que ton monitoring est pas trop bruyant sinon tu vas avoir des alertes fantômes
crenaud
Membre depuis le 26/04/2024
et le scrape interval de ton node_exporter c'est quoi si c'est 15s ou 30s c'est bon mais si c'est 1m bah forcément tu vas capter l'info plus tard. faut que ton scrape soit plus petit que ton for duration
lmarty
Membre depuis le 10/05/2024
ok merci pour les tips. j'ai mis le for à 1m et le scrape interval était déjà à 15s. je vais voir ce que ça donne mais ça devrait être mieux. je ferai un retour si ça pose problème