Debuguer les latences d'écriture disque sur un node EKS

suzanne-alexandre 09/05/2026
RÉSOLU
suzanne-alexandre
Auteur Actif
Avatar de suzanne-alexandre
suzanne-alexandre
Auteur Actif

J'ai un nœud EKS qui subit des pics de latence disque énormes sur des volumes EBS GP3. Mes logs iostat montrent un await qui monte au-delà de 200ms par moment.

Comment puis-je isoler si c'est le volume qui sature ses IOPS ou si c'est le kernel qui bloque sur le filesystem ?

09/05/2026 à 05:11

10 commentaires

As-tu vérifié les métriques CloudWatch pour le volume ? Si tu as atteint la limite de débit ou d'IOPS, EBS throttle tes requêtes en mode silencieux.

09/05/2026 à 20:09
suzanne-alexandre
Auteur Actif
Avatar de suzanne-alexandre
suzanne-alexandre
Auteur Actif

Oui, les métriques montrent une utilisation à 90% du quota alloué. Mais ça n'explique pas pourquoi le système semble figé.

10/05/2026 à 17:16

Regarde du côté de dmesg pour voir s'il n'y a pas des erreurs blk_update_request. Si le kernel attend trop longtemps, il finit par marquer le filesystem en lecture seule parfois.

11/05/2026 à 13:17

Utilise iotop -o pour identifier le processus coupable. Ça pourrait être un backup ou un process logrotate qui sature la bande passante.

12/05/2026 à 02:59
suzanne-alexandre
Auteur Actif
Avatar de suzanne-alexandre
suzanne-alexandre
Auteur Actif

Bonne idée, je n'avais pas pensé à iotop en mode batch. Je vais le laisser tourner quelques minutes.

12/05/2026 à 16:32

Si tu es sur une instance Nitro, tu peux aussi monitorer les EBSBandwidth via la console EC2 pour corréler les pics.

13/05/2026 à 14:34

Si le throughput est le problème, bascule sur du io2 ou augmente simplement la taille du volume GP3 pour obtenir plus d'IOPS par défaut.

14/05/2026 à 09:11
suzanne-alexandre
Auteur Actif
Avatar de suzanne-alexandre
suzanne-alexandre
Auteur Actif

Je viens d'identifier le processus : c'est un agent de log qui écrit des fichiers énormes en mode synchrone. Je vais passer en asynchrone pour voir si ça calme le jeu.

15/05/2026 à 02:35

Excellente approche. Évite toujours les écritures synchrones sur des disques réseaux si tu n'en as pas strictement besoin pour la cohérence des données.

15/05/2026 à 14:39
suzanne-alexandre
Auteur Actif
Avatar de suzanne-alexandre
suzanne-alexandre
Auteur Actif

Problème résolu. Merci pour l'aide précieuse sur l'investigation système.

16/05/2026 à 09:52

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire
An Error Occurred: Internal Server Error

Oops! An Error Occurred

The server returned a "500 Internal Server Error".

Something is broken. Please let us know what you were doing when this error occurred. We will fix it as soon as possible. Sorry for any inconvenience caused.