Skip to content
This repository has been archived by the owner on Aug 2, 2023. It is now read-only.

Question | RNA file _waldec and _import | cache #20

Closed
fas3r opened this issue May 15, 2019 · 3 comments
Closed

Question | RNA file _waldec and _import | cache #20

fas3r opened this issue May 15, 2019 · 3 comments

Comments

@fas3r
Copy link

fas3r commented May 15, 2019

Bonjour,

Je souhaiterai mettre en place un provisioning automatique qui recupere les fichiers rna_import_***.zip et rna_waldec_***.zip chaque 1er du mois (et s'ils ne sont pas dispo, postponer toutes les 6/12/24h).

Est ce que je peux les telecharger directement depuis https://media.interieur.gouv.fr en respectant le format https://media.interieur.gouv.fr/rna/rna_***_20180801.zip ou il est preferable de parser les balises <a> quand dans le fichier suivant afin de recuperer les liens et ainsi telecharger les fichiers depuis https://media.interieur.gouv.fr ?

Derniere question, est ce qu'il est possible qu'une association disposant d'un SIRET/SIREN n'apparaisse pas dans les fichiers RNA ? (pour savoir si je devrai inclure aussi la base sirene de facon similaire)

Merci d'avance.

@Samuelfaure
Copy link
Contributor

Samuelfaure commented May 20, 2019

Bonjour !

1/ A priori vous pouvez faire les deux méthodes, j'ai personnellement choisi de parser data.gouv pour obtenir les liens, pour plusieurs raisons :
a) Fiabilité des équipes data.gouv
b) Je ne suis pas sûr qu'il y ait un index des fichiers dispo sur le ministère de l'intérieur, alors que depuis data.gouv on peut s'assurer de toujours connaitre les derniers fichiers disponibles

2/ A priori le RNA doit recenser TOUTES les associations, nous n'avons pas encore eu connaissance d'associations manquantes.
A priori, la base SIRENE devrait recenser TOUTES les associations disposant d'un siret/siren.
Attention, le siret/siren est souvent mal renseigné dans RNA, et le numéro RNA est souvent mal renseigné dans SIRENE.

Si vous n'avez besoin que des associations, l'api RNA devrait répondre à vos besoins.

En vous remerciant pour votre interet, je fermerais cette issue dans une semaine si vous n'avez pas d'autres questions

@fas3r
Copy link
Author

fas3r commented May 20, 2019

Bonjour @Samuelfaure ,

1/ Effectivement je pense que votre maniere est la plus judicieuse.

2/ Oui j'ai vu ca.

Si jamais vous avez des conseillez pour le reformattage des donnees comme les addresses postal, je suis preneurs sinon vous pouvez fermer le ticket, je devrai trouver la reponse dans les sources ^^

Merci pour votre retour.

@Samuelfaure
Copy link
Contributor

l'API renvoie les données brutes du RNA, qui sont souvent de qualité très médiocres, hélas je n'ai pas vraiment de conseil pour en améliorer la qualité..

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants