Repository with sources and generator of https://larlet.fr/david/ https://larlet.fr/david/
您最多选择25个主题 主题必须以字母或数字开头,可以包含连字符 (-),并且长度不得超过35个字符

article.md 4.1KB

title: Les outils manquants de l'OpenData slug: les-outils-manquants-opendata date: 2011-03-28 00:29:58 type: post vignette: images/logos/rdf.png contextual_title1: Retour sur l'OpenData et nous, et nous, et nous ? contextual_url1: 20110322-retour-sur-lopendata-et-nous-et-nous-et-nous contextual_title2: ★ De l'OpenData au LinkedData : exemple de nosdonnees.fr contextual_url2: 20101130-de-lopendata-au-linkeddata-exemple-de-nosdonneesfr contextual_title3: ★ Discussions sur les applications web libres contextual_url3: 20091202-discussions-sur-les-applications-web-libres

Réflexions au sujet des outils de l’OpenData, entamés lors de la préparation de mon intervention à l’événement L’OpenData et nous, et nous, et nous ?, davantage axées sur le point de vue du développeur et sur ce qu’il serait intéressant de faire au niveau technique.

Le GoogHub de la donnée

La décentralisation nécessite d’avoir un index centralisé, que ce soit Google pour le Web de documents ou GitHub pour les DCVS il faut un endroit où l’on puisse chercher parmi les sources, toujours plus nombreuses. Un service est nécessaire pour indexer le Web des données, informer sur le versionnement et la fraîcheur des données, voire peut-être servir de proxy à une partie de ces données.

Idéalement, dans un Web de données liées, un tel index serait moins utile car il suffirait de suivre les liens mais force est de constater que l’on en est aux données ouvertes et pas très liées. Les données libérées sont brutes et les liens entre jeux de données issus d’une même source sont quasi-inexistants, ce qui limite leur valeur.

Des frameworks d’exploitation

Pour que les développeurs se mettent à jouer avec des données, il va falloir les aider à convertir ces données brutes en données réutilisables dans leur langage de prédilection. J’avais commencé à implémenter une telle solution mais je me suis épuisé faute d’avoir des données exploitables. À la fois en qualité (mais ça peut se nettoyer avec du temps) mais surtout en relations entre les données.

Si on prend la métaphore culinaire, il manque à la fois des ingrédients et le saladier qui va permettre de mélanger tout ça pour obtenir un bon gâteau. Aujourd’hui on se focalise trop sur des outils de visualisation de données brutes qui sont tape à l’œil mais qui ne valorisent pas plus que ça les données, tout au plus 2/3 jeux sont croisés, c’est l’équivalent de souffler dans la farine pour faire un joli nuage. C’est beau mais pas très utile et on reste sur notre faim.

Avoir des frameworks permettant de parcourir le graphe des données liées serait autrement plus séduisant pour un développeur et permettrait également d’aller vers l’enrichissement du graphe, au-delà de la simple exploitation.

Une plateforme de monétisation

Il ne faut pas confondre ouvert et gratuit pour les données ouvertes au même titre que l’opposition libre et gratuite qui a fait beaucoup de mal aux logiciels libres. Bien sûr, je suis le premier à faire la promotion de données ouvertes ET gratuites, surtout lorsqu’elles sont publiques mais il n’y a pas que les données publiques qui vont être libérées et il faut avoir des solutions pour les entreprises qui souhaitent vendre leurs données.

D’un point de vue utilisateur, il faudra que la plateforme permette d’avoir un interlocuteur unique et que les données soient présentées de façon suffisamment granulaire pour permettre de choisir à la carte. Le prix sera fonction de la fraîcheur et de la fréquence de mise à jour de la donnée, ces critères vont devenir capitaux. Une donnée périmée est un mensonge :-).

J’ai bien conscience que la combinaison de ces 3 outils est un cauchemar centralisé qui donnerait un contrôle beaucoup trop important à son implémenteur. Malheureusement, c’est ce qui se profile à l’horizon et je vois peu d’alternatives possibles, autant du côté des libristes que de celui de l’État…