Problème de 'Split-Brain' sur un cluster RabbitMQ

Posté par thierry-christelle le 20/08/2025
RÉSOLU

thierry-christelle

Membre depuis le 28/12/2020

yo la team, j'ai mon cluster rabbitmq sur k8s qui a craqué après une coupure réseau. les nodes se voient plus et chacun fait sa vie de son côté. j'ai des queues qui divergent et je sais pas comment resynchroniser tout ça sans tout perdre

2026-04-16 10:22:15 [error] <0.452.0> Mnesia(rabbit@pod-0): ** ERROR ** mnesia_event got {inconsistent_database, starting_partitioned_network, rabbit@pod-1}

une astuce pour forcer un node à suivre l'autre ?

Commentaires

marc-pinto

Membre depuis le 22/05/2024

faut restart les pods un par un je pense, ça devrait recréer le cluster tout seul

gcordier

Membre depuis le 15/03/2019

le restart suffira pas si mnesia est déjà corrompu. faut que tu choisisses un node 'maître' (celui qui a les data les plus fraîches) et que tu reset les autres

rabbitmqctl stop_app
rabbitmqctl reset
rabbitmqctl join_cluster rabbit@pod-maitre
rabbitmqctl start_app
  • pense à mettre `cluster_partition_handling = autoheal` dans ta conf pour la prochaine fois
  • thierry-christelle

    Membre depuis le 28/12/2020

    le reset a fonctionné pour réintégrer les nodes. j'ai ajouté l'autoheal dans ma configmap. thx !

    Laisser une réponse

    Vous devez être connecté pour poster un message !

    Rejoindre la communauté

    Recevoir les derniers articles gratuitement en créant un compte !

    S'inscrire