salut t'as regardé la métrique CPU Steal Time sur tes instances EC2 ? si tu es sur une instance t2/t3/t4g et que tu manques de crédits CPU ça peut impacter les I/O disk vu que le système d'exploitation est ralenti. même si c'est pas les IOPS qui sont le souci, le traitement des IO par le kernel peut l'être.
vous êtes des génies ! c'était les crédits cpu en fait. même si la cpu utilization était basse, le steal time montait en flèche pendant ces périodes. j'ai mis mes instances en t3.medium au lieu de t3.small et le problème a disparu. et j'ai trouvé un vieux cron qui faisait un find / -type f -mtime +30 -delete à des heures aléatoires. clean ! merci
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
alexandrie82
Membre depuis le 30/12/2020actif
bonjour les devs, on a des VMs (EC2) avec des volumes EBS gp3 et on observe des latences I/O qui spike aléatoirement. des fois c'est nickel 1-2ms et d'un coup ça monte à 100-200ms pendant quelques secondes puis ça redescend. ça arrive n'importe quand même quand le load est faible.
la métrique burst balance de l'ebs est toujours à 100%. les crédits sont pas le souci. des pistes sur ce qui pourrait causer ces micro-ralentissements ?