linux perf disk i/o sature sur ec2 m5d des idées

Question

salut les pros du kernel. j'ai un problème de perf i/o sur des instances ec2 m5d (nvme local storage) sur lesquelles on a des bases de données postgres. l'iostat montre que le disque est à 100% busy la plupart du temps mais le débit est pas énorme genre 200MB/s alors que les m5d sont censées taper beaucoup plus. on a monté les volumes avec noatime et des options de performance. le scheduler i/o est en mq-deadline. des pistes pour optimiser ?

# iostat -x 1
avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           5.20    0.00    3.50   50.10    0.00   41.20

Device            r/s     w/s     rkB/s     wkB/s   rrqm/s   wrqm/s  %rrqm  %wrqm  svctm  %util
nvme0n1         120.00  1000.00  5000.00  200000.00    0.00    0.00   0.00   0.00  8.00  100.00

joseph79 · Answer

yo le mq-deadline c'est bien mais pour le nvme des fois none ou noop est mieux. essaie de le changer avec echo none > /sys/block/nvme0n1/queue/scheduler et vois si ça change quelque chose. et la taille des blocs de ton filesystem ? si tu as de petits fichiers et un gros block size ça peut être inefficace

margaret04 · Answer

t'as regardé la queue depth de ton postgres ou de ton app ? si elle est trop faible tu n'envoies pas assez de requêtes i/o en parallèle au disque pour le saturer de manière efficace. et aussi check le swappiness. si tu swap ça flingue les perfs i/o même avec du nvme

gaillard-bernadette · Answer

un truc à ne pas négliger c'est le monitoring des métriques nvme direct via nvme-cli. ça te donnera des infos plus fines sur le disque que iostat. des fois les drivers linux ou le firmware nvme ont des soucis. et les m5d sont partagées entre plusieurs instances sur un même host physique aws attention aux voisins bruyants

carpentier-aurore · Answer

ok merci pour les tips. après pas mal de tests j'ai switché le scheduler à none c'était un peu mieux. mais le vrai game changer a été d'augmenter la queue depth de postgres et d'ajuster le commit_delay. et le swappiness était bien réglé. maintenant l'iostat est plus cohérent avec les specs de l'instance. merci la team

linux perf disk i/o sature sur ec2 m5d des idées

4 commentaires

Laisser une réponse

Gérez vos conteneurs avec le Docker Compose

Comprendre, Gérer et Manipuler un cluster Docker Swarm

Comment optimiser vos Images Docker ?

Ambient Mesh : Simplifiez vos microservices, réinventez l'orchestration et la sécurité

Maîtriser la gestion mémoire : Le guide ultime pour vos pods

Rejoindre la communauté