AWS Glue : Error 'Container killed by YARN for exceeding memory limits'

Question

yo j'ai un job Glue (Spark) qui traite un gros CSV sur S3 et ça crash systématiquement après 10 min. le log d'erreur est pas hyper clair sur quel worker explose

Command failed with exit code 1. Details: Container killed by YARN for exceeding memory limits. 5.5 GB of 5.5 GB physical memory used.

j'ai déjà mis des G.2X mais ça repousse juste le problème de quelques minutes...

olivier-lucie · Answer

t'as essayé de passer ton format de fichier en Parquet ? le CSV c'est l'enfer pour la mémoire car Spark doit tout inférer

gregoire-vincent · Answer

le souci vient souvent du 'skewness' de tes données ou de fichiers trop gros non splittables (genre un gros .csv.gz). si t'utilises des dynamicframes, essaie de forcer un repartition ou utilise le paramètre groupfiles dans la source s3 pour équilibrer la charge sur les workers# dans ton create_dynamic_frame.from_options
"groupFiles": "inPartition"

lrichard · Answer

le groupFiles avec un repartition a sauvé le job. les workers sont bien équilibrés mtn. thx !

AWS Glue : Error 'Container killed by YARN for exceeding memory limits'

3 commentaires

Laisser une réponse

Faciliter le déploiements k8s avec Kustomize

Comprendre et utiliser Filebeat dans la stack ELK

eBPF : Le Superpouvoir DevOps pour l'Observabilité et la Sécurité

L'Ère du Developer Productivity Engineering : Propulser l'Innovation DevOps

Cloud IDE vs Local-First : Pourquoi le « Tout-en-Ligne » Échoue

Rejoindre la communauté