Perf I/O dégueu sur serveur DB après upgrade kernel

emmanuelle-humbert 09/06/2025
RÉSOLU
emmanuelle-humbert
Auteur Actif
Avatar de emmanuelle-humbert
emmanuelle-humbert
Auteur Actif

bonjour la communauté. après avoir upgrade le kernel sur nos serveurs postgres de production les perfs i/o ont chuté drastiquement. on est passé du kernel 5.15 à 6.2. les disques sont des nvme super rapides. avant on avait des iops de folie maintenant c tout lent. iostat montre des latences énormes


# Exemple de iostat -x 1
avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           5.00    0.00    3.00   45.00    0.00   47.00

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz await r_await w_await  svctm  %util
nvme0n1           0.00     0.00    0.00  100.00     0.00  400.00    8.00    15.00 150.00    0.00  150.00   5.00  50.00
09/06/2025 à 23:11

7 commentaires

martin-catherine
Membre Actif Secouriste
Avatar de martin-catherine
martin-catherine
Membre Actif Secouriste

slt. kernel 6.2 c pas anodin. as-tu vérifié quel scheduler i/o est actif maintenant ? des fois les defaults changent d'une version à l'autre. regarde dans /sys/block/nvme0n1/queue/scheduler

Modifié le 23/05/2026 à 16:20
emmanuelle-humbert
Auteur Actif
Avatar de emmanuelle-humbert
emmanuelle-humbert
Auteur Actif

ouh là c'est cfq ! avant on était en noop il me semble. j'ai pas pensé à ça du tout. cfq c'est pas top pour les ssd non ?

Modifié le 23/05/2026 à 16:20
claire49
Membre Actif
Avatar de claire49
claire49
Membre Actif

CFQ est une catastrophe pour les NVMe. c'est un scheduler conçu pour les disques rotatifs. pour les SSD et surtout les NVMe tu veux mq-deadline ou carrément none si ton hardware gère bien. le kernel 6.x a pu changer le default par erreur pour ton type de disque

Modifié le 23/05/2026 à 16:20
emmanuelle-humbert
Auteur Actif
Avatar de emmanuelle-humbert
emmanuelle-humbert
Auteur Actif

ok merci pour l'info je savais pas que cfq était encore là. comment je peux changer ça en live sans rebooter pour tester ?

13/06/2025 à 16:47
martin-catherine
Membre Actif Secouriste
Avatar de martin-catherine
martin-catherine
Membre Actif Secouriste

tu peux faire un echo mq-deadline > /sys/block/nvme0n1/queue/scheduler pour le nvme0n1. ça change à la volée. si ça améliore les perfs faut le rendre permanent via grub ou une règle udev

Modifié le 23/05/2026 à 16:20
claire49
Membre Actif
Avatar de claire49
claire49
Membre Actif

oui teste ça. et aussi vérifie tes options de montage fstab pour tes filesystems. assure-toi d'avoir noatime et potentiellement discard pour les ssd. ça aide aussi avec les perfs

Modifié le 23/05/2026 à 16:20
emmanuelle-humbert
Auteur Actif
Avatar de emmanuelle-humbert
emmanuelle-humbert
Auteur Actif

vous avez tapé dans le mille ! j'ai switché en mq-deadline et les latences ont fondu. les iops sont revenus à la normale. je vais automatiser le changement. merci infiniment pour votre aide !

Modifié le 23/05/2026 à 16:20

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire