Problème de 'Split-Brain' sur un cluster RabbitMQ

thierry-christelle 20/08/2025
RÉSOLU

yo la team, j'ai mon cluster rabbitmq sur k8s qui a craqué après une coupure réseau. les nodes se voient plus et chacun fait sa vie de son côté. j'ai des queues qui divergent et je sais pas comment resynchroniser tout ça sans tout perdre

2026-04-16 10:22:15 [error] <0.452.0> Mnesia(rabbit@pod-0): ** ERROR ** mnesia_event got {inconsistent_database, starting_partitioned_network, rabbit@pod-1}

une astuce pour forcer un node à suivre l'autre ?

20/08/2025 à 13:07

3 commentaires

marc-pinto
Membre Actif
Avatar de marc-pinto
marc-pinto
Membre Actif

faut restart les pods un par un je pense, ça devrait recréer le cluster tout seul

21/08/2025 à 08:28
gcordier
Membre
Avatar de gcordier
gcordier
Membre

le restart suffira pas si mnesia est déjà corrompu. faut que tu choisisses un node 'maître' (celui qui a les data les plus fraîches) et que tu reset les autres

rabbitmqctl stop_app
rabbitmqctl reset
rabbitmqctl join_cluster rabbit@pod-maitre
rabbitmqctl start_app
  • pense à mettre cluster_partition_handling = autoheal dans ta conf pour la prochaine fois
  • Modifié le 23/05/2026 à 16:20

    le reset a fonctionné pour réintégrer les nodes. j'ai ajouté l'autoheal dans ma configmap. thx !

    23/08/2025 à 03:25

    Laisser une réponse

    Vous devez être connecté pour poster un message !

    Rejoindre la communauté

    Recevoir les derniers articles gratuitement en créant un compte !

    S'inscrire