grosse latence sur une appli web avec du i/o wait étrange

Posté par ogomez le 15/05/2025
RÉSOLU

ogomez

Membre depuis le 14/09/2024

on a une app web qui a des latences de dingue de temps en temps genre 10 secondes pour une requête simple. et htop nous montre de l'i/o wait de fou. c'est sur une vm linux classique avec des disques ssd virtuels (cloud provider). la db est externe. j'ai checké iotop rien d'évident. une piste ?

Commentaires

gros-victor

Membre depuis le 23/05/2024

hmm i/o wait ça peut être plein de trucs. déjà c'est quel type de système de fichiers ? ext4 xfs ? et c'est un système d'exploitation à jour kernel y compris ?

maury-lucy

Membre depuis le 15/11/2024

t'as des logs qui sont écrits en masse sur ce disque ? genre log4j qui fait n'importe quoi ou un journald qui sature ? un journal de base de données si c'est une db locale cachée quelque part

catherine-pineau

Membre depuis le 28/12/2024

regarde du côté de blktrace ou iostat -x 1 pour avoir plus de détails sur les opérations d'i/o bloquantes. et la queue des requêtes de disque est-elle pleine ? genre sous /sys/block/sdX/queue/rotational /rq_affinity

ogomez

Membre depuis le 14/09/2024

c'est ext4 et le kernel est plutôt à jour. on écrit pas des tonnes de logs ça va. pas de db locale. j'ai fait un iostat -x 1 et je vois des temps de service (svctm) super élevés sur le disque principal

gros-victor

Membre depuis le 23/05/2024

temps de service élevé ça veut dire que le disque est lent à répondre. même si c'est un ssd virtuel ça peut arriver si la vm est sur-provisionnée ou si le provider a des soucis sur le host physique. t'as essayé de monter un autre disque ou de changer de vm type ?

maury-lucy

Membre depuis le 15/11/2024

et le scheduler d'i/o du kernel t'as regardé ? noop deadline cfq ? si c'est une vm avec ssd le noop est souvent le meilleur choix. ptete que c'est le scheduler qui met le bordel

ogomez

Membre depuis le 14/09/2024

OMG c'était le scheduler ! il était en cfq au lieu de noop. après avoir changé ça et redémarré (un petit coup de echo noop > /sys/block/sda/queue/scheduler), les temps de service sont revenus à la normale et l'appli est fluide. merci les gars pour l'aide précieuse !

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire