-
Notifications
You must be signed in to change notification settings - Fork 13
Open
Description
Sur insee.fr on peut trouver toute une série d'indicateurs conjoncturels d'activités (ICA)
L'URL est assez bien structuré et permet donc de récupérer facilement ces données. Par exemple, au hasard, pour récupérer la série 010539343
(celle-ci). L'URL est le suivant:
https://www.insee.fr/fr/statistiques/serie/telecharger/csv/010539343?ordre=antechronologique&transposition=donneescolonne&periodeDebut=1&anneeDebut=1999&periodeFin=6&anneeFin=2021
On peut donc identifier la structure suivante:
https://www.insee.fr/fr/statistiques/serie/telecharger/csv/{IDENTIFIANT}?ordre=antechronologique&transposition=donneescolonne&periodeDebut=1&anneeDebut={ANNEE_DEBUT}&periodeFin=6&anneeFin={ANNEE_FIN}
qui permet de requêter facilement plusieurs séries avec une fonction aux arguments bien faits.
Dans pynsee, tous les éléments sont en place pour récupérer ces données, en modularisant le code ci-dessous. Je pense que c'est pareil pour doremifasol
import os
import requests
from pynsee.download import download_pb, unzip_pb
download_pb("https://www.insee.fr/fr/statistiques/serie/telecharger/csv/010539344?ordre=antechronologique&transposition=donneescolonne&periodeDebut=1&anneeDebut=1999&periodeFin=6&anneeFin=2021",fname = "data.zip")
unzip_pb("data.zip", "ica", desc="Extracting")
os.listdir()
os.listdir("./ica")
J'ai donc deux questions:
- est-ce que vous êtes partants pour intégrer ces sources dans
doremifasol
? - A votre avis, quelle est la meilleure manière d'intégrer ces sources ? Doit-on intégrer ça au JSON ou faire une fonction qui plugge des arguments dans un url, sans faire les vérifications (md5 checksum...) faites pour les autres sources de données ?
Metadata
Metadata
Assignees
Labels
No labels