Salut ! T'as check les logs d'erreurs MySQL et les slow query logs ? Des fois même avec peu de charge une seule requete mal optimisée peut lock des tables et créer des embouteillages. Regarde les innodb status aussi.
j'ai les slow query logs rien d'anormal les requêtes qui sont lentes le sont habituellement pas. Et rien dans les logs d'erreur. l'innodb status est clean aussi
et les metrics de burst credit pour ton volume EBS ? si tu es sur gp2 et que t'as dépensé tous tes crédits même avec peu d'iops ça peut te brider grave la performance
ah ça ! j'ai un volume GP3 j'ai provisionné 3000 iops et 125 Mo/s c'est censé être suffisant et stable. les metrics montrent que je suis loin des limites provisionnées
c pas des backups ou des maintenance windows qui se lancent en plein milieu de la nuit et qui foutent le bordel ? ou des snapshots automatiques rds
les backups sont schedulés une fois par jour et en dehors des heures de pointe. et la maintenance window est la nuit mais pas au moment des spikes. y'a rien dans les events rds
t'as essayé de changer le type d'instance juste pour voir ? des fois certains types sont moins stables que d'autres sur rds. ou de passer en multi-az pour voir si la bascule vers le standby corrige le souci
j'ai pas encore essayé de changer de type. c'est une multi-az déjà c'est ça le pire
regarde les connection counts. si t'as une appli qui ouvre / ferme des milliers de connexions a la seconde ça peut saturer les threads MySQL même si les requetes sont rapides
j'ai max_connections a 2000 et je monte a peine a 50-60 connexions actives. c'est pas ça
ok un truc con mais qui arrive : ton monitoring externe. si t'as un nagios/zabbix/prometheus qui se connecte toutes les secondes et fait des requetes de check un peu lourdes ça peut créer des micro-contention surtout si t'as plein d'agents
BINGO ! on avait un script de monitoring custom qui faisait un show full processlist toutes les 10s et ça foutait la merde. je l'ai désactivé et depuis plus aucun pic de latence. putain merci le coup de la connerie ça m'a sauvé !
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
etienne46
Membre depuis le 17/07/2019actif
yo la commu j'ai un truc de ouf avec notre RDS MySQL. on a une instance m5.large qui est censée encaisser pas mal de charge mais des fois on a des pics de latence à plus de 500ms sur des requêtes simples alors que le CPU est à 5% et l'IOPS est super bas. ça arrive n'importe quand même la nuit quand y'a personne. c'est ultra chiant pour l'app