Explosion des coûts Egress sur GCP inter-régions

Posté par bjean le 03/05/2025
RÉSOLU

bjean

Membre depuis le 22/11/2018

actif

yo la team finops on a un souci avec notre facture GCP du mois dernier. les coûts d'egress inter-régions ont explosé de 200% on comprend pas pourquoi. on a nos services en `europe-west1` qui appellent des services de données en `europe-west3` mais d'habitude c'est stable

on a pas changé grand chose dans le code ou l'infra. juste des mises à jour de quelques libs et des déploiements classiques. mais rien qui justifie un x3 sur l'egress. comment on peut debug ça proprement sur GCP ? les outils de facturation c'est pas super précis

Commentaires

sdesousa

Membre depuis le 01/09/2024

actif secouriste

hmm egress inter-régions ça sent le data transfer entre zones ou régions. t'as checké les logs de tes load balancers ou proxys inversés si y'en a ? des fois une mauvaise config redirige tout le trafic vers une région lointaine avant de revenir

margaret04

Membre depuis le 07/03/2019

actif

regarde le Network Intelligence Center sur GCP. ça te donne des graphes et des logs sur le trafic réseau. tu peux filtrer par projet par région. ça va te montrer d'où vient le trafic qui coûte cher

bjean

Membre depuis le 22/11/2018

actif

ok je vais voir ça pour le Network Intelligence Center. on n'a pas de LB entre les services c'est du direct via l'IP privée des GKE pods

sdesousa

Membre depuis le 01/09/2024

actif secouriste

ip privée des gke pods qui appellent des services de données dans une autre région ? comment ça ? vous utilisez des private service connect ou des vpn pour ça ? ou c'est des ips publiques par accident ?

bjean

Membre depuis le 22/11/2018

actif

non non c des VPC peering entre les régions. c pour ça que d'habitude c stable et pas cher. c sensé être du trafic inter-vpc en interne

margaret04

Membre depuis le 07/03/2019

actif

vpc peering c cool mais ça reste inter-région et ça coûte cher si le volume est gros. le prix varie pas mal. 0.01$/gb je crois entre eu-west1 et eu-west3

t'as pas un bug de cache ou un truc qui fait que tes applis re-téléchargent des grosses bases de données à chaque démarrage ou à chaque requête ? un genre de cache invalidation violent

bjean

Membre depuis le 22/11/2018

actif

putain mais oui ! j'ai eu une idée. on a mis à jour une librairie de notre ORM et elle a un mode "lazy loading" par défaut sur certaines relations qui avant étaient eager. elle fait des requêtes N+1 et recharge des gros blobs de données à chaque appel

et ces blobs sont stockés sur un Cloud Storage dans eu-west3. avant c'était pas chargé du tout

sdesousa

Membre depuis le 01/09/2024

actif secouriste

HA. bingo. classic. une petite modif de lib et hop la facture décolle. c ça le finops. faut traquer les appels réseau

le network intelligence center va te confirmer ça avec les débits sortants de tes gke pods vers cloud storage en eu-west3

bjean

Membre depuis le 22/11/2018

actif

ouais je viens de regarder. c'est exactement ça. des téraoctets qui partent des GKE vers GCS. c'est le lazy loading du ORM. on va le désactiver ou le reconfigurer. putain merci les gars le Network Intelligence Center m'a donné les métriques pour le prouver

margaret04

Membre depuis le 07/03/2019

actif

good job. ces coûts d'egress c'est le piège numéro un en cloud. surtout entre régions ou vers internet. faut toujours être vigilant

bjean

Membre depuis le 22/11/2018

actif

c'est clair je suis grillé pour ce mois. mais au moins on sait d'où ça vient et on peut corriger. thx beaucoup

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire