i/o wait énorme sur un lvm pour db

Question

salut la commu
j'ai un serveur db (postgresql) qui tourne sur une vm linux et depuis quelques jours on a des pics d'i/o wait qui monte à 80-90%. la db est sur un LVM au-dessus d'un raid logiciel. les disques sous-jacents sont censés être des SSD NVMe performants mais la situation est intenable

# top ou htop montrent souvent ça
%Cpu(s):  0.3 us,  0.7 sy,  0.0 ni, 12.0 id, 86.0 wa,  0.0 hi,  0.0 si,  0.0 st

j'ai vérifié les logs postgres pas d'énormes requêtes cheloues pas de gros vacuum qui tourne. le monitoring montre que le read/write iops est pas non plus délirant comparé à la capacité des disques. ça sent le mystère

corinne37 · Answer

hello t'as check si d'autres process que postgres n'utilisent pas le disque regarde avec iostat -xz 1 ou pidstat -d 1 pour voir qui bouffe les i/o

alphonse20 · Answer

ouais j'ai fait ça et c'est bien postgres qui est en tête des i/o avec son process principal et ses workers. mais le volume total d'iops est pas si élevé comparé à ce qu'on devrait avoir sur du nvme

mace-aimee · Answer

c'est peut-être pas un problème de volume d'iops mais de latence individuelle des i/o. t'as des outils pour mesurer la latence des i/o genre fio ou des métriques du kernel direct sur les disques sous-jacents pas juste sur le lvm

oguillon · Answer

si c'est une vm assure-toi que le virtio-scsi est bien utilisé et que t'as pas de souci de file d'attente i/o au niveau de l'hyperviseur des fois le host est surchargé et ça impacte les invités même si les disques sont rapides

alphonse20 · Answer

alors en fait en creusant côté hyperviseur et en regardant les métriques du SAN (on est sur du fibre channel derrière) il y avait bien un souci de qdepth trop faible sur les chemins d'accès au stockage. les disques étaient rapides mais la file d'attente était saturée très vite. le provider a ajusté la config

alphonse20 · Answer

après l'ajustement c'est tombé à 5% d'i/o wait c'est le jour et la nuit. merci pour l'aide les gars la piste hyperviseur/san était la bonne

i/o wait énorme sur un lvm pour db

6 commentaires

Laisser une réponse

Introduction du cours pour apprendre l'orchestrateur Kubernetes (k8s)

Les rôles sur Ansible

Faciliter le déploiements k8s avec Kustomize

Internal Developer Platforms (IDP) : Libérez le Potentiel de vos Développeurs

SRE vs DevOps : Le clash des cultures qui paralyse vos déploiements

Rejoindre la communauté