Encodage des fichiers .csv : soucis d'import dans PostgreSQL

Bonjour !

En prenant l'ensemble des fichiers csv par département présents sur http://data.cquest.org/geo_sirene/v2019/last/dep/, je me suis fait mordre par PostgreSQL avec un :

`value too long for type character varying(26)`

En effet, j'ai repris la définition des variables présentes dans les fichiers CSV https://www.sirene.fr/sirene/public/static/liste-variables en créant un table PostgreSQL avec la bonne longueur des différents champs. Par exemple : 

* `distributionSpecialeEtablissement` : https://www.sirene.fr/sirene/public/variable/distributionSpecialeEtablissement type TEXTE longueur 26
* `complementAdresseEtablissement` : https://www.sirene.fr/sirene/public/variable/complementAdresseEtablissement type TEXTE, longueur 38

Puis en faisant un bête `COPY CSV TO`, j'ai eu des chaînes parfois plus longues. Deux exemples : 

* Département 33, `POLYCLI BX NORD MED VASCULAIRE NÂ°15A33` en tant que valeur de la variable `complementAdresseEtablissement` qui a donc ici une longueur 39 pour 38 attendue

* Département 13, `CENTRAIX ET NÂ°2 AV DU 8 MA` pour la valeur de la variable `distributionSpecialeEtablissement`

Je me demande si dans le filtre ou le découpage d'entités par département, y'aura pas un soucis d'encodage qui se glisse.

Pour l'instant, j'ai augmenté la taille de mes champs.

Merci,
Damien G.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Encodage des fichiers .csv : soucis d'import dans PostgreSQL #13

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Encodage des fichiers .csv : soucis d'import dans PostgreSQL #13

Description

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions