Repository with sources and generator of https://larlet.fr/david/ https://larlet.fr/david/
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

article.md 4.1KB

123456789101112131415161718192021222324252627282930313233343536373839
  1. title: Les outils manquants de l'OpenData
  2. slug: les-outils-manquants-opendata
  3. date: 2011-03-28 00:29:58
  4. type: post
  5. vignette: images/logos/rdf.png
  6. contextual_title1: Retour sur l'OpenData et nous, et nous, et nous ?
  7. contextual_url1: 20110322-retour-sur-lopendata-et-nous-et-nous-et-nous
  8. contextual_title2: ★ De l'OpenData au LinkedData : exemple de nosdonnees.fr
  9. contextual_url2: 20101130-de-lopendata-au-linkeddata-exemple-de-nosdonneesfr
  10. contextual_title3: ★ Discussions sur les applications web libres
  11. contextual_url3: 20091202-discussions-sur-les-applications-web-libres
  12. Réflexions au sujet des outils de l'OpenData, entamés lors de la préparation de mon intervention à l'événement [L'OpenData et nous, et nous, et nous ?](https://larlet.fr/david/biologeek/archives/20110322-retour-sur-lopendata-et-nous-et-nous-et-nous/), davantage axées sur le point de vue du développeur et sur ce qu'il serait intéressant de faire au niveau technique.
  13. ## Le GoogHub de la donnée ##
  14. **La décentralisation nécessite d'avoir un index centralisé**, que ce soit Google pour le Web de documents ou GitHub pour les DCVS il faut un endroit où l'on puisse chercher parmi les sources, toujours plus nombreuses. Un service est nécessaire pour indexer le Web des données, informer sur le versionnement et la fraîcheur des données, voire peut-être servir de proxy à une partie de ces données.
  15. Idéalement, dans un Web de données **liées**, un tel index serait moins utile car il suffirait de suivre les liens mais force est de constater que l'on en est aux données ouvertes et pas très liées. Les données libérées sont brutes et les liens entre jeux de données issus d'une même source sont quasi-inexistants, ce qui limite leur valeur.
  16. ## Des frameworks d'exploitation ##
  17. Pour que les développeurs se mettent à jouer avec des données, il va falloir les aider à convertir ces données brutes en données réutilisables dans leur langage de prédilection. J'avais commencé à implémenter une telle solution mais je me suis épuisé faute d'avoir des données exploitables. À la fois en qualité (mais ça peut se nettoyer avec du temps) mais surtout en relations entre les données.
  18. Si on prend la métaphore culinaire, il manque à la fois des ingrédients et le saladier qui va permettre de mélanger tout ça pour obtenir un bon gâteau. Aujourd'hui **on se focalise trop sur des outils de visualisation de données brutes** qui sont tape à l'œil mais qui ne valorisent pas plus que ça les données, tout au plus 2/3 jeux sont croisés, c'est l'équivalent de souffler dans la farine pour faire un joli nuage. C'est beau mais pas très utile et on reste sur notre faim.
  19. Avoir des frameworks permettant de parcourir le graphe des données liées serait autrement plus séduisant pour un développeur et permettrait également d'aller vers l'enrichissement du graphe, au-delà de la simple exploitation.
  20. ## Une plateforme de monétisation ##
  21. **Il ne faut pas confondre ouvert et gratuit pour les données ouvertes** au même titre que l'opposition libre et gratuite qui a fait beaucoup de mal aux logiciels libres. Bien sûr, je suis le premier à faire la promotion de données ouvertes ET gratuites, surtout lorsqu'elles sont publiques mais il n'y a pas que les données publiques qui vont être libérées et il faut avoir des solutions pour les entreprises qui souhaitent vendre leurs données.
  22. D'un point de vue utilisateur, il faudra que la plateforme permette d'avoir un interlocuteur unique et que les données soient présentées de façon suffisamment granulaire pour permettre de choisir à la carte. Le prix sera fonction de la fraîcheur et de la fréquence de mise à jour de la donnée, ces critères vont devenir capitaux. **Une donnée périmée est un mensonge** :-).
  23. J'ai bien conscience que **la combinaison de ces 3 outils est un cauchemar centralisé** qui donnerait un contrôle beaucoup trop important à son implémenteur. Malheureusement, c'est ce qui se profile à l'horizon et je vois peu d'alternatives possibles, autant du côté des libristes que de celui de l'État…