t'as regardé les logs du kernel ? dmesg | grep 'I/O error' ou des trucs comme ça. des fois c'est juste le disque qui a une micro-panne côté hyperviseur. et iostat -xm 5 pour voir les latences directes sur le device. regarde la colonne await et avgqu-sz
et si c'est pas le disque direct, c'est ptete le scheduler I/O. quel scheduler est actif sur ton device ? cat /sys/block/sdX/queue/scheduler. si t'es sur un SSD c'est souvent noop ou mq-deadline qui est mieux que cfq. cfq est bien pour les hdd mais pas les ssd
ok j'ai checké iostat, les latences sont bien là. pas d'erreurs kernel. mais le scheduler... j'étais en cfq ! je viens de le passer en mq-deadline avec echo mq-deadline > /sys/block/nvme0n1/queue/scheduler et les perfs sont redevenues stables instantanément. c'était bien ça ! merci pour le coup de main c'était pas du tout aws le pb
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
paul54
Membre depuis le 09/09/2019actif
yo la team, j'ai une vm ubuntu avec une appli java qui fait bcp d'io sur un disque EBS. des fois on a des gros lags genre 500ms alors que d'habitude c 10ms. les métriques aws montrent rien de spécial côté volume. la vm est pas surchargée cpu/mem. ca sent le truc linux deep