Résoudre les blocages de I/O sur des disques EBS avec fio

arnaud-jean 12/05/2026
RÉSOLU
arnaud-jean
Auteur
Avatar de arnaud-jean
arnaud-jean
Auteur

Hello, j'ai des latences disque inexplicables sur un node EKS. Mes pods ont des IOPS qui chutent brutalement par moments. Je veux valider si c'est un problème de quota EBS ou de saturation du bus.

Quelqu'un a un profil fio fiable pour simuler une charge réelle et tester les limites de mon volume ?

12/05/2026 à 21:00

13 commentaires

Utilise un job fio avec un mix de lecture/écriture aléatoire pour reproduire la prod. Voici une base :

[global]
size=10G
runtime=60s
iodepth=32
[random-rw]
rw=randrw
blocksize=4k
13/05/2026 à 17:57
nmichaud
Membre
Avatar de nmichaud
nmichaud
Membre

Attention, si c'est du gp3, vérifie bien tes IOPS provisionnés via l'API AWS. Parfois, c'est juste le burst balance qui est épuisé.

14/05/2026 à 08:53
arnaud-jean
Auteur
Avatar de arnaud-jean
arnaud-jean
Auteur

Le burst balance est à 100%. Je suspecte plutôt une contention sur le réseau vu que c'est du EBS.

14/05/2026 à 22:39

Regarde les métriques EBSByteBalance% et EBSIOBalance% dans CloudWatch. Si elles tombent à zéro, tu es bridé par AWS.

15/05/2026 à 12:23

Tu peux aussi monitorer le iowait avec iostat -x 1 pour voir si tes processus attendent vraiment le disque.

16/05/2026 à 09:35
nmichaud
Membre
Avatar de nmichaud
nmichaud
Membre

Si tu es sur une instance Nitro, le débit est lié à la taille de l'instance. Vérifie si tu n'as pas atteint la limite de débit de l'instance elle-même (Network/EBS bandwidth).

17/05/2026 à 07:39
arnaud-jean
Auteur
Avatar de arnaud-jean
arnaud-jean
Auteur

Je viens de vérifier, je suis sur une m5.large, le débit EBS est limité à 4750 Mbps. C'est peut-être là le bottleneck.

18/05/2026 à 02:46

Effectivement, avec 4750 Mbps, tu satures très vite si tu fais du logging intensif sur le même volume.

19/05/2026 à 00:21

Je te conseille de séparer tes logs des données de ton application sur un volume différent pour isoler les IOPS.

19/05/2026 à 17:05
nmichaud
Membre
Avatar de nmichaud
nmichaud
Membre

Tu peux tester l'isolation avec un fio ciblant uniquement le répertoire de logs pour voir l'impact réel.

20/05/2026 à 14:45
arnaud-jean
Auteur
Avatar de arnaud-jean
arnaud-jean
Auteur

Bonne idée, je vais isoler les logs sur un emptyDir en mémoire pour tester si la latence applicative disparaît.

21/05/2026 à 13:29

Si ça marche, migre tes logs vers un sidecar ou un logging driver plus léger comme fluentbit.

22/05/2026 à 04:55
arnaud-jean
Auteur
Avatar de arnaud-jean
arnaud-jean
Auteur

Le passage en mémoire a réduit la latence de 60%. C'était bien une saturation du débit EBS lié aux logs. Merci pour l'aide !

23/05/2026 à 03:20

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire