Explosion des coûts RDS sans raison apparente

qriou 24/04/2025
RÉSOLU
qriou
Auteur Actif
Avatar de qriou
qriou
Auteur Actif

Salut la team j'ai une mauvaise surprise ce mois-ci nos coûts RDS ont doublé sans qu'on ait fait de changements majeurs sur l'infra ou que la charge applicative ait explosé. on est sur du PostgreSQL en db.m5.large. j'ai checké les métriques cloudwatch CPU RAM network tout est stable. quelqu'un a déjà vu ça ?

24/04/2025 à 09:34

8 commentaires

stephane-ramos
Membre Actif Secouriste
Avatar de stephane-ramos
stephane-ramos
Membre Actif Secouriste

Salut ! le truc classique c'est les backups. la rétention des snapshots automatiques ? quelqu'un a pu l'augmenter massivement ? ou des snapshots manuels non supprimés ? le stockage backup coûte cher sur RDS

25/04/2025 à 07:48
rcourtois
Membre Actif
Avatar de rcourtois
rcourtois
Membre Actif

autre piste les read replicas. y'en a pas un qui aurait été créé par erreur ou qui aurait scalé automatiquement ? ou si t'es en multi-AZ vérifie que la config est toujours bonne parce qu'une perte d'AZ peut parfois faire des trucs bizarres de failover qui augmentent les coûts temporairement

26/04/2025 à 03:19
stephane-ramos
Membre Actif Secouriste
Avatar de stephane-ramos
stephane-ramos
Membre Actif Secouriste

et les IOPS ? si t'es en gp2 t'as un burstable credit. si l'activité I/O a soudainement augmenté même sans explosion CPU ça peut te faire payer de l'over-provisioning ou du burst qui est cher. regarde les métriques BurstBalance et DiskQueueDepth

Modifié le 23/05/2026 à 16:20
cthomas
Membre Actif
Avatar de cthomas
cthomas
Membre Actif

la conso de data transfer out est à surveiller. si une app a commencé à récupérer des Giga/Terra de données depuis RDS vers un service hors de la région ou même hors d'AWS ça peut monter vite

27/04/2025 à 18:10
stephane-ramos
Membre Actif Secouriste
Avatar de stephane-ramos
stephane-ramos
Membre Actif Secouriste

regarde bien le détail dans Cost Explorer par ressource. des fois c'est un truc con genre une instance db.m5.large qui est passée en db.m5.xlarge suite à une manip ou un script d'autoscaling mal configuré. même si t'as pas vu de changelog ça arrive

Modifié le 23/05/2026 à 16:20
rcourtois
Membre Actif
Avatar de rcourtois
rcourtois
Membre Actif

si t'es sur Aurora c'est différent mais ça peut être le backtrack window qui a été étendu ou le stockage des logs qui a explosé pour une raison X. regarde la facturation spécifique à Aurora

Modifié le 23/05/2026 à 16:20
stephane-ramos
Membre Actif Secouriste
Avatar de stephane-ramos
stephane-ramos
Membre Actif Secouriste

et si t'as plusieurs environnements vérifie les tags. des fois des ressources de dev ou staging se retrouvent non taguées et se cachent dans le budget global. utilise aws-nuke --no-dry-run pour rigoler un coup

Modifié le 23/05/2026 à 16:20
qriou
Auteur Actif
Avatar de qriou
qriou
Auteur Actif

bon c'était un peu tout ce que vous avez dit. en fait quelqu'un a augmenté la rétention des backups automatiques à 30 jours au lieu de 7 "juste au cas où". et une instance de dev non taguée était restée en db.r5.large au lieu d'une petite db.t3.micro et avait pas été supprimée. cumulé ça a fait le double. merci pour les pistes !

Modifié le 23/05/2026 à 16:20

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire