Skip to content

Conversation

barbotinerie
Copy link
Contributor

Deux notebooks: un explopfas où je fais de l'explo sur les pfas (il est pas abouti et actuellement il plante donc vous embêtez même pas à l'ouvrir) et un extractionpauline avec le code où j'extrait les paramètres uniques de toute la base de données sur toutes les années pour la demande de Pauline (pour info c'est ce notebook là qui monte jusqu'à quasi 16Go de RAM pendant bien 10 minutes quand je le lance)

@barbotinerie barbotinerie reopened this Feb 7, 2025
@jereze jereze self-requested a review February 7, 2025 16:26
Copy link
Contributor

@jereze jereze left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Je ne pense pas que pandasql passe ses calculs à duckdb, ça doit charger le dataframe entier en mémoire avec pandas et offrir une syntaxe SQL-like, donc n'aide pas à résoudre le problème de "performance"/mémoire.
J'ai plutôt un avis défavorable à l'installer pour tous les bénévoles, cela peut porter à confusion.
Plutôt se reporter sur les autres outils proposés.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants