IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Open data : neuf bases de données de référence mises à la disposition du public
Y compris le registre des entreprises et la base adresse nationale

Le , par Michael Guilloux

139PARTAGES

15  0 
Lesquelles de ces bases de données vous semblent utiles pour vos applications ?
base adresse nationale (BAN)
53 %
code officiel géographique (COG)
47 %
registre des entreprises (base SIRENE)
40 %
plan cadastral informatisé
20 %
répertoire opérationnel des métiers et des emplois (ROME)
20 %
base de données de l'organisation administrative de l'État
13 %
registre parcellaire graphique (RPG)
13 %
répertoire national des associations (RNA)
13 %
référentiel à grande échelle (RGE)
7 %
Aucune
13 %
Pas d'avis
7 %
Voter 15 votants
La mission Etalab fait partie de la Direction interministérielle du numérique et du système d’information et de communication de l’État (DINSIC), et c'est elle qui coordonne la politique d’ouverture et de partage des données publiques (open data).

Du 29 septembre au 20 octobre 2016, la mission Etalab a organisé une consultation sur la mise en œuvre du Service public de la donnée. Rappelons-le, ce service a été créé par l’Article 14 de la loi pour une République numérique. Il vise à mettre à la disposition du public, les jeux de données de référence qui présentent le plus fort impact économique et social, en vue de faciliter leur réutilisation.

La consultation organisée l’année dernière a vu la contribution de 160 personnes (secteur public, associations, entreprises et particuliers) et a permis de valider la première liste de données de références à rendre publiques. Il s'agissait notamment :

  • du Registre des entreprises (base SIRENE) : un jeu de données qui permet d’accéder aux 9 millions d’entreprises et 10 millions d’établissements actifs du répertoire Sirene de l’Insee ;
  • du répertoire national des associations (RNA) : il contient toutes les associations de France, dont le siège est déclaré en métropole ou dans les départements d’outre-mer, sauf dans les départements de la Moselle, du Bas-Rhin et du Haut-Rhin, qui relèvent du régime du Concordat. Le RNA contient également les associations reconnues d’utilité publique ;
  • du Cadastre (le plan cadastral informatisé) ;
  • du référentiel à grande échelle (RGE) : il est composé de cinq composantes (orthophotographique, topographique, altimétrique, parcellaire et adresse) qui fournissent des informations géographiques cohérentes entre elles ;
  • du registre parcellaire graphique (RPG) : une base de données géographiques servant de référence à l'instruction des aides de la politique agricole commune ;
  • de la base adresse nationale (BAN), qui a pour but de référencer l'intégralité des adresses du territoire français. Elle contient la position géographique de plus de 25 millions d'adresses.

Par un décret signé le 14 mars dernier, cette liste a été complétée par :

  • la base de données de l'organisation administrative de l'État, qui comprend toutes les institutions régies par la Constitution de la Ve République et les administrations qui en dépendent, soit environ 6000 organismes ;
  • le répertoire opérationnel des métiers et des emplois (ROME) : construit par Pôle Emploi, il est décrit comme un outil au service de la mobilité professionnelle et du rapprochement entre offres et candidats ;
  • le code officiel géographique (COG), qui rassemble les codes et libellés des communes, des cantons, des arrondissements, des départements, des régions, des collectivités d'outre-mer et des pays et territoires étrangers au 1er janvier de chaque année.


Le service public de la donnée s'ouvre officiellement avec les neuf bases de données de référence mentionnées. Il faut toutefois noter que les données du plan cadastral informatisé ne sont pas encore disponibles, mais devraient l’être bientôt.


Les données et métadonnées sont disponibles sous différents formats selon le cas : CSV, PDF, XML, HTML, TXT, ZIP, etc. Pour la base adresse nationale, une API de géocodage a également été mise à la disposition du public.

Chaque producteur de données doit publier ses engagements sur les conditions de la mise à disposition (documentation des données, fréquence de mise à jour, performance et disponibilité de la mise à disposition). La mission Etalab publiera sur son site les indicateurs de disponibilité des données, et assurera plus généralement le suivi du respect de ces engagements.

Cette liste n’est qu’un début. Pendant la consultation de la mission Etalab, les répondants ont en effet mentionné un total de 57 bases de données qui devraient passer en open data. Parmi les données les plus demandées, on peut citer celles des réseaux routiers (graphe, points kilométriques, comptage), des réseaux d'énergie, le répertoire national des élus, les données des marchés publics, les données météorologiques et les données de population (ménages, revenus).

Rappelons qu’en janvier, c’est la RATP (Régie autonome des transports parisiens) qui annonçait la disponibilité en open data de ses données de trafic. Ces initiatives permettront certainement aux développeurs de développer des applications et services utiles alimentés par ces données.

Sources : data.gouv.fr, Mission Etalab

Et vous ?

Qu’en pensez-vous ?
Lesquelles de ces bases de données vous semblent utiles pour vos applications ?

Voir aussi :

Paris : la RATP met en open data ses données de trafic en temps réel, une nouvelle opportunité pour les développeurs d'applications

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de tanaka59
Inactif https://www.developpez.com
Le 08/10/2018 à 23:07
Des données publiques ou il n'y a pas de partage ni de cohérence nationale j'ai deux exemples :

* une recensement du trafic routier au niveau nationales avec des Excel ... pour éviter d'alimenter la polémique sur la circulation de certains axes routiers ... c'est politiquement incorrect d'avoir ou d'avancer certains chiffres. Un chiffre pour faire peur politiquement incorrect ... L'autoroute A4/A86 en IDF voit passer 300 000 véhicules par jour ... C'est l'axe autoroutier le plus emprunté d’Europe ! Même les sections du BP parisiens ne voient pas passer autant de voiture ...

* le trafic SNCF par ligne ... forcement faut pas alimenter la concurrence ...

Politiquement avoir ces chiffres peut permettre nuire à la réalisation d'un projet en justifiant qu'il y a trop de ... donc il ne faut pas faire.

En résumé la non diffusion ou la non harmonisation est une histoire de couleur politique ... On aussi dire de même pour des chiffres diffusées par la CAF qui ont subitement changé sous la mandature Hollande en 2012 ...
6  0 
Avatar de
https://www.developpez.com
Le 10/04/2017 à 11:35
Sympa comme initiative, mais pas de JSON disponible?

C'est pourtant beaucoup plus léger que CSV ou XML à traiter...
0  0 
Avatar de bretus
Membre éprouvé https://www.developpez.com
Le 10/04/2017 à 22:52
Citation Envoyé par Artemix Voir le message
C'est pourtant beaucoup plus léger que CSV ou XML à traiter...
Je dirais pas ça pour charger ces données... Faire des lectures ligne par ligne de fichier CSV de plusieurs millions de lignes est généralement (*) plus direct que faire des lectures enregistrement par enregistrement dans des JSON ou XML (approche événementielle type SAX).

En bonus, il existe de nombreux outils (ETL, ogr2ogr, etc.) qui sont plus simples à configurer avec du CSV en entrée que du JSON ou XML où il faut gérer les arborescences.

Du coup, pour des données brutes, je préfère largement traiter du CSV plutôt que du JSON.

C'est généralement au niveau des API où l'on peut paginer/limiter les résultats que l'on trouvera du JSON plus facile à exploiter que du CSV. Ça tombe bien car ces API pullulent quand les données brutes sont disponibles et facilement intégrables (voir liste des réutilisations de la base SIREN ou OpenDataSoft).

(*) Si les vilains CSV n'étaient pas légion, ce serait le cas général. Le problème n'est pas CSV en soit, mais le non respect de la RFC 4180, voire de la tendance à produire des CSV pourris (caractères non échappés)
0  0