Postgres qui bouffe le CPU sur une query triviale même avec index

Question

Salut. j'ai un souci bizarre sur une de nos instances RDS PostgreSQL 14. Une query super simple genre

select * from ma_grosse_table where id = 12345;

met 50ms et bouffe 10% de cpu alors que id est un bigint primary key. la table fait 500 millions de lignes. c'est quoi le bordel

emmanuel67 · Answer

Salut. 50ms pour un PK lookup c'est chelou. t'as run un explain analyze sur ta query

luce-martin · Answer

ouais bien sûr. c'est un index scan mais le cost est super haut. des fois il fait un seq scan même pour un id uniqueEXPLAIN ANALYZE SELECT * FROM ma_grosse_table WHERE id = 12345;
                                                      QUERY PLAN                                                     
-----------------------------------------------------------------------------------------------------------------------
 Index Scan using ma_grosse_table_pkey on ma_grosse_table  (cost=0.57..8.59 rows=1 width=230) (actual time=0.022..0.023 rows=1 loops=1)
   Index Cond: (id = 12345)
 Planning Time: 0.123 ms
 Execution Time: 0.035 ms

emmanuel67 · Answer

le explain que tu files est rapide. c'est peut-être pas toujours le cas ou c'est pas la query exacte. regarde si t'as pas de table bloat ou d'index bloat. un VACUUM FULL sur la table peut aider mais ça bloque tout attention

luce-martin · Answer

oui c'était un exemple pour montrer. le problème est intermittent. j'ai vu des articles sur le bloat. comment je check ça proprement sans bloquer la prod

emmanuel67 · Answer

tu peux utiliser l'extension pg_stat_statements pour voir les vrais temps et les queries les plus chères. pour le bloat tu as des requêtes sur pg_stat_all_tables et pg_indexes qui te donnent des stats de tupples vivants/morts et la taille des index. ou utiliser pg_repack

luce-martin · Answer

j'ai run un check et ouais l'index PK est bloated de ouf genre 40%. pas étonnant le query planner doit hésiter à l'utiliser. pg_repack ça nécessite un downtime

emmanuel67 · Answer

pg_repack c'est sans downtime normalement. mais ça prend des ressources. t'as regardé ton autovacuum config. il tourne assez souvent et avec les bons params pour ta table de 500M

luce-martin · Answer

autovacuum est en mode par défaut. ptete qu'il galère avec la taille. faudrait augmenter autovacuum_vacuum_scale_factor ou autovacuum_analyze_scale_factor pour cette table spécifique

emmanuel67 · Answer

exactement. ou baisser le threshold. faut trouver le bon équilibre pour pas qu'il tourne en permanence non plus. et ton work_mem il est comment sur ta session. des fois des gros join ou sort peuvent faire péter le cpu si ça déborde sur disk

luce-martin · Answer

work_mem est à 4MB. c'est pas pour des grosses queries c'est vraiment juste le lookup par PK. j'ai essayé de relancer ANALYZE ma_grosse_table; pour rafraîchir les stats mais ça change rien

emmanuel67 · Answer

le souci est ptete pas dans la query elle-même mais dans l'état de l'index. si tu reconstruis l'index avec REINDEX TABLE ma_grosse_table; ça résoudra le bloat mais ça bloque la table. sinon tu peux créer un nouvel index en parallèle puis drop l'ancien

luce-martin · Answer

créer un nouvel index en parallèle c pas con. genre CREATE INDEX CONCURRENTLY nouveau_pk ON ma_grosse_table (id); puis après je vire l'ancien et je le renomme

emmanuel67 · Answer

oui mais tu peux pas faire ça sur un PK direct. tu dois d'abord drop la contrainte PK et la recréer. ou tu crées un unique index en concurrently, drop la PK, et recrée la PK sur le nouvel index. c'est tricky

luce-martin · Answer

arf oui c'est plus compliqué que prévu. je vais tenter avec pg_repack sur un env de staging d'abord pour voir l'impact. si ça marche je ferais ça sur la prod avec une fenêtre de maintenance courte

luce-martin · Answer

bon j'ai testé pg_repack en staging. l'index est nickel maintenant. les queries sont instantanées. je vais planifier ça pour la prod. merci pour l'aide ça m'a sauvé la mise

Postgres qui bouffe le CPU sur une query triviale même avec index

15 commentaires

Laisser une réponse

Les différences entre la virtualisation et la conteneurisation

Les bases fondamentales de l'affichage graphique en SDL2

Les Pages Wiki sur GitLab pour centraliser votre documentation

Guide : Orchestrer le Pooling de Mémoire CXL avec Kubernetes DRA

Optimisez vos images Docker : La méthode multi-stage

Rejoindre la communauté