Repository with sources and generator of https://larlet.fr/david/ https://larlet.fr/david/
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

index.html 14KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176
  1. <!doctype html>
  2. <html lang=fr>
  3. <head>
  4. <!-- Always define the charset before the title -->
  5. <meta charset=utf-8>
  6. <title>Les outils manquants de l&#39;OpenData — Biologeek — David Larlet</title>
  7. <!-- Define a viewport to mobile devices to use - telling the browser to assume that the page is as wide as the device (width=device-width) and setting the initial page zoom level to be 1 (initial-scale=1.0) -->
  8. <meta name="viewport" content="width=device-width, initial-scale=1"/>
  9. <!-- Fake favicon, to avoid extra request to the server -->
  10. <link rel="icon" href="data:;base64,iVBORw0KGgo=">
  11. <link type="application/atom+xml" rel="alternate" title="Feed" href="/david/log/" />
  12. <link rel="manifest" href="/manifest.json">
  13. <link rel="stylesheet" href="/static/david/css/larlet-david-_J6Rv.css" data-instant-track />
  14. <noscript>
  15. <style type="text/css">
  16. /* Otherwise fonts are loaded by JS for faster initial rendering. See scripts at the bottom. */
  17. body {
  18. font-family: 'EquityTextB', serif;
  19. }
  20. h1, h2, h3, h4, h5, h6, time, nav a, nav a:link, nav a:visited {
  21. font-family: 'EquityCapsB', sans-serif;
  22. font-variant: normal;
  23. }
  24. </style>
  25. </noscript>
  26. <!-- Canonical URL for SEO purposes -->
  27. <link rel="canonical" href="https://larlet.fr/david/biologeek/archives/20110328-les-outils-manquants-opendata">
  28. </head>
  29. <body>
  30. <div>
  31. <header>
  32. <nav>
  33. <p>
  34. <small>
  35. Je suis <a href="/david/" title="Profil public">David Larlet</a>, <a href="/david/pro/" title="Activité professionnelle">artisan</a> du web qui vous <a href="/david/pro/accompagnement/" title="Activité d’accompagnement">accompagne</a><span class="more-infos"> dans l’acquisition de savoirs pour concevoir des <a href="/david/pro/produits-essentiels/" title="Qu’est-ce qu’un produit essentiel ?">produits essentiels</a></span>. <span class="more-more-infos">Discutons ensemble d’une <a href="/david/pro/devis/" title="En savoir plus">non-demande de devis</a>.</span> Je partage ici mes <a href="/david/blog/" title="Expériences bienveillantes">réflexions</a> et <a href="/david/correspondances/2017/" title="Lettres hebdomadaires">correspondances</a>.
  36. </small>
  37. </p>
  38. </nav>
  39. </header>
  40. <section>
  41. <h1 property="schema:name">Les outils manquants de l&#39;OpenData</h1>
  42. <article typeof="schema:BlogPosting">
  43. <div property="schema:articleBody">
  44. <img src="/static/david/biologeek/images/logos/rdf.png" alt="vignette" style="float:left; margin: 0.5em 1em;" property="schema:thumbnailUrl" />
  45. <p>Réflexions au sujet des outils de l'OpenData, entamés lors de la préparation de mon intervention à l'événement <a href="https://larlet.fr/david/biologeek/archives/20110322-retour-sur-lopendata-et-nous-et-nous-et-nous/">L'OpenData et nous, et nous, et nous ?</a>, davantage axées sur le point de vue du développeur et sur ce qu'il serait intéressant de faire au niveau technique.</p>
  46. <h2>Le GoogHub de la donnée</h2>
  47. <p><strong>La décentralisation nécessite d'avoir un index centralisé</strong>, que ce soit Google pour le Web de documents ou GitHub pour les DCVS il faut un endroit où l'on puisse chercher parmi les sources, toujours plus nombreuses. Un service est nécessaire pour indexer le Web des données, informer sur le versionnement et la fraîcheur des données, voire peut-être servir de proxy à une partie de ces données.</p>
  48. <p>Idéalement, dans un Web de données <strong>liées</strong>, un tel index serait moins utile car il suffirait de suivre les liens mais force est de constater que l'on en est aux données ouvertes et pas très liées. Les données libérées sont brutes et les liens entre jeux de données issus d'une même source sont quasi-inexistants, ce qui limite leur valeur.</p>
  49. <h2>Des frameworks d'exploitation</h2>
  50. <p>Pour que les développeurs se mettent à jouer avec des données, il va falloir les aider à convertir ces données brutes en données réutilisables dans leur langage de prédilection. J'avais commencé à implémenter une telle solution mais je me suis épuisé faute d'avoir des données exploitables. À la fois en qualité (mais ça peut se nettoyer avec du temps) mais surtout en relations entre les données.</p>
  51. <p>Si on prend la métaphore culinaire, il manque à la fois des ingrédients et le saladier qui va permettre de mélanger tout ça pour obtenir un bon gâteau. Aujourd'hui <strong>on se focalise trop sur des outils de visualisation de données brutes</strong> qui sont tape à l'œil mais qui ne valorisent pas plus que ça les données, tout au plus 2/3 jeux sont croisés, c'est l'équivalent de souffler dans la farine pour faire un joli nuage. C'est beau mais pas très utile et on reste sur notre faim.</p>
  52. <p>Avoir des frameworks permettant de parcourir le graphe des données liées serait autrement plus séduisant pour un développeur et permettrait également d'aller vers l'enrichissement du graphe, au-delà de la simple exploitation.</p>
  53. <h2>Une plateforme de monétisation</h2>
  54. <p><strong>Il ne faut pas confondre ouvert et gratuit pour les données ouvertes</strong> au même titre que l'opposition libre et gratuite qui a fait beaucoup de mal aux logiciels libres. Bien sûr, je suis le premier à faire la promotion de données ouvertes ET gratuites, surtout lorsqu'elles sont publiques mais il n'y a pas que les données publiques qui vont être libérées et il faut avoir des solutions pour les entreprises qui souhaitent vendre leurs données.</p>
  55. <p>D'un point de vue utilisateur, il faudra que la plateforme permette d'avoir un interlocuteur unique et que les données soient présentées de façon suffisamment granulaire pour permettre de choisir à la carte. Le prix sera fonction de la fraîcheur et de la fréquence de mise à jour de la donnée, ces critères vont devenir capitaux. <strong>Une donnée périmée est un mensonge</strong> :-).</p>
  56. <p>J'ai bien conscience que <strong>la combinaison de ces 3 outils est un cauchemar centralisé</strong> qui donnerait un contrôle beaucoup trop important à son implémenteur. Malheureusement, c'est ce qui se profile à l'horizon et je vois peu d'alternatives possibles, autant du côté des libristes que de celui de l'État…</p>
  57. </div>
  58. </article>
  59. <footer>
  60. <h6 property="schema:datePublished">— 28/03/2011</h6>
  61. </footer>
  62. </section>
  63. <section>
  64. <div>
  65. <h3>Articles peut-être en rapport</h3>
  66. <ul>
  67. <li><a href="/david/biologeek/archives/20110322-retour-sur-lopendata-et-nous-et-nous-et-nous/" title="Accès à Retour sur l&#39;OpenData et nous, et nous, et nous ?">Retour sur l&#39;OpenData et nous, et nous, et nous ?</a></li>
  68. <li><a href="/david/biologeek/archives/20101130-de-lopendata-au-linkeddata-exemple-de-nosdonneesfr/" title="Accès à ★ De l&#39;OpenData au LinkedData : exemple de nosdonnees.fr">★ De l&#39;OpenData au LinkedData : exemple de nosdonnees.fr</a></li>
  69. <li><a href="/david/biologeek/archives/20091202-discussions-sur-les-applications-web-libres/" title="Accès à ★ Discussions sur les applications web libres">★ Discussions sur les applications web libres</a></li>
  70. </ul>
  71. </div>
  72. </section>
  73. <section>
  74. <div id="comments">
  75. <h3>Commentaires</h3>
  76. <div class="comment" typeof="schema:UserComments">
  77. <p class="comment-meta">
  78. <span class="comment-author" property="schema:creator">Michael Sokol</span> le <span class="comment-date" property="schema:commentTime">28/03/2011</span> :
  79. </p>
  80. <div class="comment-content" property="schema:commentText">
  81. <p>Bonjour,</p>
  82. <p>J&#39;aimerai reprendre certains points énoncés. À commencer par le premier. Un index centralisé, oui, mais pour qui ? Est-ce l&#39;homme qui sera l&#39;utilisateur final de ces données, ou est-ce la machine ?</p>
  83. <p>Si c&#39;est l&#39;homme, alors un système de recherche comme Google fonctionne parfaitement et nous permet de trouver des résultats pour la majorité de nos questions.</p>
  84. <p>Si c&#39;est la machine, la donne est différente. Le web des données, Linked Data, est un réseau lié. Un set de donnée ne fait pas partie du Linked Data s&#39;il n&#39;est pas rattaché à d&#39;autres données. Ceci permet donc, en théorie, aux machines d&#39;obtenir des résultats sur l&#39;ensemble des données disponible, au moyen d&#39;un point d&#39;accès SPARQL, par exemple.</p>
  85. <p>La difficulté est plus profonde que cela. Le problème n&#39;est pas d&#39;obtenir des résultats, mais d&#39;obtenir de bons résultats, et là, comment savoir si la donnée de X sera plus valable que celle d’Y ? Se pose également le problème du vocabulaire employé (le choix ontologique).</p>
  86. <p><a href="http://sindice.com/">http://sindice.com/</a> est une initiative d&#39;indexation, permettant à l&#39;homme et à la machine d&#39;accéder à des données RDF d&#39;une grande partie du web sémantique.</p>
  87. <p>En ce qui concerne les outils pour développeur nous avons largement de quoi faire. Beaucoup de framework, open-source pour la plupart existent, par exemple JENA.</p>
  88. <p>Le web sémantique existe depuis une dizaine d&#39;années. Je suis d&#39;accord que les outils sont souvent complexes, et qu&#39;ils nécessitent un grand niveau d&#39;expertise, mais ils sont présents. Peut-être que nous nous attendons à voir une révolution avec le web des données, alors que c&#39;est simplement une évolution.</p>
  89. <p>Les standards sont là, les outils sont là, il faut maintenant que les publieur d’information décident de sémantiser leur données.</p>
  90. </div>
  91. </div>
  92. <div class="comment" typeof="schema:UserComments">
  93. <p class="comment-meta">
  94. <span class="comment-author" property="schema:creator">Yann Kempf</span> le <span class="comment-date" property="schema:commentTime">28/03/2011</span> :
  95. </p>
  96. <div class="comment-content" property="schema:commentText">
  97. <p>Je ne suis pas tout à fait d&#39;accord avec le premier point énoncé.<br />Il commence à exister des réseaux P2P avec des index partagés en quelque sorte. Utilisés pour les réseaux sociaux décentralisés.<br />Et c&#39;est donc plusieurs &quot;micro webs&quot; qui se forment pour les réseaux d&#39;amis.<br />Mais reste une intelligence collective pour permettre aux gens de parcourir ces micro webs.</p>
  98. <p>Tous les standards ne sont pas là mais c&#39;est en bonne voie ^^</p>
  99. </div>
  100. </div>
  101. <div class="comment" typeof="schema:UserComments">
  102. <p class="comment-meta">
  103. <span class="comment-author" property="schema:creator">Martin - Webaaz</span> le <span class="comment-date" property="schema:commentTime">28/03/2011</span> :
  104. </p>
  105. <div class="comment-content" property="schema:commentText">
  106. <p>Une donnée périmée est un mensonge ? Je ne suis pas d&#39;accord, si la date est clairement énoncée c&#39;est utile, il n&#39;y a pas que l&#39;instant présent qui est important, l&#39;historique aussi ! </p>
  107. <p>Je pense que c&#39;est aussi ton propos, mais ce n&#39;est pas très clair je trouve ;-)</p>
  108. <p>Sinon j&#39;approuve ta vision du partage données gratuites / payantes, sujet sur lequel je n&#39;avais pas pas encore d&#39;avis, tu amènes de la matière à ma réflexion !</p>
  109. </div>
  110. </div>
  111. <div class="comment" typeof="schema:UserComments">
  112. <p class="comment-meta">
  113. <span class="comment-author" property="schema:creator">Pierre Col - Antidot</span> le <span class="comment-date" property="schema:commentTime">28/03/2011</span> :
  114. </p>
  115. <div class="comment-content" property="schema:commentText">
  116. <p>Pour ceux qui chercheraient un outil capable de valoriser et exploiter des données non structurées ou semi-structurées pour les publier dans le web des données, notamment dans un triple store RDF, je signale la solution Antidot Information Factory, qui a été dévoilée en avant-première sur le salon Documation.<br />Doc ici : <a href="http://bit.ly/AIF-v1">http://bit.ly/AIF-v1</a></p>
  117. <p>Ce logiciel, conjugué au moteur de recherche Antidot Finder Suite, a permis de mener à bien le grand projet ISIDORE du CNRS / TGE Adonis qui donne accès au public le plus large à plus d&#39;un million de publications scientifiques en sciences humaine set sociales, issues de plus de 750 sources différentes, via un portail web - <a href="http://rechercheisidore.fr">http://rechercheisidore.fr</a> - et aussi via un SparQL endpoint....</p>
  118. <p>Explications techniques très concrètes sur ce premier grand projet web sem / open data français ici : <a href="http://bit.ly/CasClientISIDORE">http://bit.ly/CasClientISIDORE</a></p>
  119. <p>Voilà, vous savez tout, ou presque :-)</p>
  120. </div>
  121. </div>
  122. <div class="comment" typeof="schema:UserComments">
  123. <p class="comment-meta">
  124. <span class="comment-author" property="schema:creator">SwingMobility</span> le <span class="comment-date" property="schema:commentTime">08/04/2011</span> :
  125. </p>
  126. <div class="comment-content" property="schema:commentText">
  127. <p>Un peu en accord avec Yann, pour le sujet des index.</p>
  128. <p>On le voit au niveau des réseaux sociaux : un grand index où tout le monde se retrouve, et des index alternatifs, à côté, beaucoup plus décentralisés.</p>
  129. </div>
  130. </div>
  131. </div>
  132. </section>
  133. <footer>
  134. <nav>
  135. <p>
  136. <small>
  137. Je réponds quasiment toujours aux <a href="m&#x61;ilto:d&#x61;vid%40l&#x61;rlet&#46;fr" title="Envoyer un email">emails</a> (<a href="/david/signature/" title="Ma signature actuelle avec possibilité de chiffrement">signés</a>) et vous pouvez me rencontrer à Montréal. <span class="more-infos">N’hésitez pas à <a href="/david/log/" title="Être tenu informé des mises à jour">vous abonner</a> pour être tenu informé des publications récentes.</span>
  138. </small>
  139. </p>
  140. </nav>
  141. </footer>
  142. </div>
  143. <script src="/static/david/js/larlet-david-3ee43f.js" data-no-instant></script>
  144. <script data-no-instant>InstantClick.init()</script>
  145. </body>
  146. </html>