I/O sur une VM Linux qui part en vrille sans raison apparente

Question

salut tout le monde j'ai une vm linux (debian 11) avec une bdd (postgres) et j'ai une activité disque hyper élevée des fois sans que la bdd soit sollicitée plus que d'habitude. genre je vois des iowait à 80% alors que le nombre de queries est bas et les requêtes sont rapides
# vmstat -w 1 5
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
0  1      0 102432  65536 1048576    0    0  2048 20480 1500 3000  5  5 10 80  0

suzanne-fischer · Answer

tu as checké quel process fait le plus d'i/o avec iotop ou d'autres outils comme pidstat -d ? des fois c'est un truc inattendu genre un cron job qui fait un backup ou un outil de monitoring un peu trop zélé

laurent-gerard · Answer

regarde aussi du côté du swap. si ta mémoire est saturée même avec peu de requêtes la vm peut commencer à swapper comme une folle et ça plombe les perfs disque même si ton swap est sur un ssd

delorme-tristan · Answer

pidstat -d me montre des pics d'i/o sur un process kworker qui fait des lectures/écritures massives. pour la swap elle est à 0. la mémoire est utilisée à 70% par postgres mais y a 30% de libre et du cache

seguin-therese · Answer

kworker qui bosse beaucoup sur l'i/o c'est souvent lié au système de fichiers lui-même ou au driver du disque. t'es sur quel fs ext4 xfs ? et c'est quoi le type de stockage sous-jacent ebs nfs local nvme ?

suzanne-fischer · Answer

si c'est xfs regarde les logs dmesg pour des erreurs de fs ou des messages de kernel. et t'as ptete des snapshots côté infra qui gèlent l'io un moment pour la cohérence des données. ça peut faire des spikes comme ça

delorme-tristan · Answer

c'est de l'ext4 sur un ebs gp3. dmesg montre rien d'anormal. par contre en regardant côté AWS on a une sauvegarde EBS quotidienne vers 3h du mat avec un snapshot de quelques secondes qui crée un freeze i/o. le kworker était la conséquence de l'accumulation des écritures pendant le freeze. on va décaler le snapshot hors des heures de prod intenses. merci les gars

I/O sur une VM Linux qui part en vrille sans raison apparente

6 commentaires

Laisser une réponse

Ce que n'est pas le DevOps

L'IA au plus près de l'action : Maîtrisez le MLOps à la Périphérie

Zero Trust DevOps : L'Ère de la Confiance Zéro en Cloud Natif

Guide : Étendre votre Service Mesh avec des filtres Wasm et Rust

DevOps & Open Source : La fin d'une lune de miel ?

Rejoindre la communauté