On dirait que ton filesystem a pris un coup et qu'un dossier de block est corrompu ou vide. Tente un cleanup manuel des dossiers vides dans le répertoire de data, ça débloque souvent le truc.
find /prometheus/data -type d -empty -delete
Si t'es sur Kubernetes, vérifie que ton mount path dans le deployment correspond bien à ce qui est défini dans ton storage class. Parfois le volume se remonte en read-only après un incident de disque.
Le `find` a fait le job, y'avait un dossier de block fantôme qui empêchait le verrouillage du storage. C'est reparti, j'ai pas perdu mes métriques. Merci les gars.
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
edouard-martin
Membre depuis le 28/10/2024Mon instance Prometheus a crashé après un reboot brutal du node. Dans les logs du container, j'ai une erreur fatale sur le storage TSDB au boot.
Comment je peux forcer le démarrage sans tout wiper ?