Sujet :

prometheus alerte cpu load trop tardive

RÉSOLU

Liste des sujets Répondre Créer un sujet

lmarty

Membre depuis le 10/05/2024

salut les sres j'ai un souci avec mes alertes prometheus sur le cpu load. quand un serveur commence à morfler je reçois l'alerte genre 5-10min après que le load soit monté. je voudrais un truc plus réactif genre max 1-2min. vous avez des tips pour optimiser ça


# extrait de ma rule prometheus
- alert: HighCPULoad
  expr: node_load1 > 8
  for: 5m
  labels:
    severity: critical
  annotations:
    summary: "CPU load est trop élevé sur {{ $labels.instance }}"

delmas-zoe

Membre depuis le 26/11/2024

ta config for 5m c'est trop long c'est ça qui retarde l'alerte essaie de le baisser à 1m ou même 30s si t'es sur que ton monitoring est pas trop bruyant sinon tu vas avoir des alertes fantômes

crenaud

Membre depuis le 26/04/2024

et le scrape interval de ton node_exporter c'est quoi si c'est 15s ou 30s c'est bon mais si c'est 1m bah forcément tu vas capter l'info plus tard. faut que ton scrape soit plus petit que ton for duration

lmarty

Membre depuis le 10/05/2024

ok merci pour les tips. j'ai mis le for à 1m et le scrape interval était déjà à 15s. je vais voir ce que ça donne mais ça devrait être mieux. je ferai un retour si ça pose problème

Répondre

vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire