I/O sur une VM Linux qui part en vrille sans raison apparente

delorme-tristan 17/01/2026
RÉSOLU
delorme-tristan
Auteur Actif Secouriste
Avatar de delorme-tristan
delorme-tristan
Auteur Actif Secouriste

salut tout le monde j'ai une vm linux (debian 11) avec une bdd (postgres) et j'ai une activité disque hyper élevée des fois sans que la bdd soit sollicitée plus que d'habitude. genre je vois des iowait à 80% alors que le nombre de queries est bas et les requêtes sont rapides

# vmstat -w 1 5
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
0  1      0 102432  65536 1048576    0    0  2048 20480 1500 3000  5  5 10 80  0
17/01/2026 à 20:30

6 commentaires

tu as checké quel process fait le plus d'i/o avec iotop ou d'autres outils comme pidstat -d ? des fois c'est un truc inattendu genre un cron job qui fait un backup ou un outil de monitoring un peu trop zélé

18/01/2026 à 20:08
laurent-gerard
Membre Actif
Avatar de laurent-gerard
laurent-gerard
Membre Actif

regarde aussi du côté du swap. si ta mémoire est saturée même avec peu de requêtes la vm peut commencer à swapper comme une folle et ça plombe les perfs disque même si ton swap est sur un ssd

19/01/2026 à 17:37
delorme-tristan
Auteur Actif Secouriste
Avatar de delorme-tristan
delorme-tristan
Auteur Actif Secouriste

pidstat -d me montre des pics d'i/o sur un process kworker qui fait des lectures/écritures massives. pour la swap elle est à 0. la mémoire est utilisée à 70% par postgres mais y a 30% de libre et du cache

20/01/2026 à 15:03
seguin-therese
Membre Actif
Avatar de seguin-therese
seguin-therese
Membre Actif

kworker qui bosse beaucoup sur l'i/o c'est souvent lié au système de fichiers lui-même ou au driver du disque. t'es sur quel fs ext4 xfs ? et c'est quoi le type de stockage sous-jacent ebs nfs local nvme ?

21/01/2026 à 14:31

si c'est xfs regarde les logs dmesg pour des erreurs de fs ou des messages de kernel. et t'as ptete des snapshots côté infra qui gèlent l'io un moment pour la cohérence des données. ça peut faire des spikes comme ça

22/01/2026 à 10:53
delorme-tristan
Auteur Actif Secouriste
Avatar de delorme-tristan
delorme-tristan
Auteur Actif Secouriste

c'est de l'ext4 sur un ebs gp3. dmesg montre rien d'anormal. par contre en regardant côté AWS on a une sauvegarde EBS quotidienne vers 3h du mat avec un snapshot de quelques secondes qui crée un freeze i/o. le kworker était la conséquence de l'accumulation des écritures pendant le freeze. on va décaler le snapshot hors des heures de prod intenses. merci les gars

23/01/2026 à 08:43

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire