Repository with sources and generator of https://larlet.fr/david/ https://larlet.fr/david/
Nevar pievienot vairāk kā 25 tēmas Tēmai ir jāsākas ar burtu vai ciparu, tā var saturēt domu zīmes ('-') un var būt līdz 35 simboliem gara.

index.html 45KB


  1. <!doctype html>
  2. <html lang=fr>
  3. <head>
  4. <!-- Always define the charset before the title -->
  5. <meta charset=utf-8>
  6. <title>★ Architecture web moderne et agile — Biologeek — David Larlet</title>
  7. <!-- Define a viewport to mobile devices to use - telling the browser to assume that the page is as wide as the device (width=device-width) and setting the initial page zoom level to be 1 (initial-scale=1.0) -->
  8. <meta name="viewport" content="width=device-width, initial-scale=1"/>
  9. <!-- Fake favicon, to avoid extra request to the server -->
  10. <link rel="icon" href="data:;base64,iVBORw0KGgo=">
  11. <link type="application/atom+xml" rel="alternate" title="Feed" href="/david/log/" />
  12. <link rel="manifest" href="/manifest.json">
  13. <link rel="stylesheet" href="/static/david/css/larlet-david-_J6Rv.css" data-instant-track />
  14. <noscript>
  15. <style type="text/css">
  16. /* Otherwise fonts are loaded by JS for faster initial rendering. See scripts at the bottom. */
  17. body {
  18. font-family: 'EquityTextB', serif;
  19. }
  20. h1, h2, h3, h4, h5, h6, time, nav a, nav a:link, nav a:visited {
  21. font-family: 'EquityCapsB', sans-serif;
  22. font-variant: normal;
  23. }
  24. </style>
  25. </noscript>
  26. <!-- Canonical URL for SEO purposes -->
  27. <link rel="canonical" href="https://larlet.fr/david/biologeek/archives/20080604-architecture-web-moderne-et-agile">
  28. </head>
  29. <body>
  30. <div>
  31. <header>
  32. <nav>
  33. <p>
  34. <small>
  35. Je suis <a href="/david/" title="Profil public">David Larlet</a>, <a href="/david/pro/" title="Activité professionnelle">artisan</a> du web qui vous <a href="/david/pro/accompagnement/" title="Activité d’accompagnement">accompagne</a><span class="more-infos"> dans l’acquisition de savoirs pour concevoir des <a href="/david/pro/produits-essentiels/" title="Qu’est-ce qu’un produit essentiel ?">produits essentiels</a></span>. <span class="more-more-infos">Discutons ensemble d’une <a href="/david/pro/devis/" title="En savoir plus">non-demande de devis</a>.</span> Je partage ici mes <a href="/david/blog/" title="Expériences bienveillantes">réflexions</a> et <a href="/david/correspondances/2017/" title="Lettres hebdomadaires">correspondances</a>.
  36. </small>
  37. </p>
  38. </nav>
  39. </header>
  40. <section>
  41. <h1 property="schema:name">★ Architecture web moderne et agile</h1>
  42. <article typeof="schema:BlogPosting">
  43. <div property="schema:articleBody">
  44. <img src="/static/david/biologeek/images/logos/architecture_web_couchdb.png" alt="vignette" style="float:left; margin: 0.5em 1em;" property="schema:thumbnailUrl" />
  45. <p>Pour rebondir sur <a href="http://www.christian-faure.net/2008/06/01/dataware-et-metadataware/">les propos de Christian</a> qui essaye de combiner <abbr title="REpresentational State Transfer">REST </abbr> et <abbr title="Resource Description Framework">RDF</abbr>, je voudrais discuter de l'architecture « idéale » à laquelle je suis arrivé. C'est une problématique à laquelle je suis confronté aussi lors de ma réflexion pour <a href="https://larlet.fr/david/biologeek/archives/20080112-ma-killer-app-pour-le-web-semantique/">la killer app sémantique</a> et qui fait partie des trois points bloquants actuels avec l'ergonomie et la confidentialité des données.</p>
  46. <h2>Avant la ressource, il y a la donnée</h2>
  47. <p>Comme le souligne Christian, <a href="https://larlet.fr/david/biologeek/archives/20070413-pour-ne-plus-etre-en-rest-comprendre-cette-architecture/">REST</a> s'adresse à des ressources et non directement à des données, d'où le problème lorsqu'on essaye de construire une <a href="https://larlet.fr/david/biologeek/archives/20070629-architecture-orientee-ressource-pour-faire-des-services-web-restful/">application RESTful</a> qui tape directement sur des triplets <a href="https://larlet.fr/david/biologeek/archives/20080425-le-point-sur-rdf-et-rdfa/">RDF</a>. Commençons par étudier le stockage, on verra l'accès plus tard.</p>
  48. <p>Il existe plusieurs moyens de stocker une donnée, on a longtemps cru que le modèle relationnel (PostreSQL, MySQL, etc) était la solution à tout mais dès que l'on est confronté à un très grand nombre de données, celui-ci atteint ses limites et <strong>laisse aujourd'hui généralement place au modèle non-structuré et distribué</strong> (CouchDB, Hadoop, BigTable, etc) qui a fait ses preuves grâce à Google.</p>
  49. <p>Malheureusement, aucun des deux n'est adapté au stockage du RDF, ce qui est à l'origine de performances assez catastrophiques lorsqu'on atteint plusieurs milliers de triplets (ce qui arrive assez rapidement). De plus le modèle de type document est puissant justement dans sa souplesse, il est possible d'ajouter des champs à la volée, il serait donc vraiment dommage de restreindre son usage à 3 champs !</p>
  50. <p>Dans l'idéal, il faudrait avoir une base performante qui soit développée spécifiquement pour stocker du RDF, en pratique <strong>je crois plus en un mapping RDF sur une base structurée existante</strong>, il y a des projets comme <a href="http://wiki.apache.org/hadoop/HRDF">HRDF pour Hadoop</a> qui tentent justement d'arriver à ça. On arriverait au schéma suivant :</p>
  51. <pre><code>Données (RDF)
  52. | MapReduce + TODO
  53. |
  54. Données sérialisées (CouchDB, Hadoop, etc)
  55. </code></pre>
  56. <p>Les opérations de <a href="http://hadoop.apache.org/core/docs/current/mapred_tutorial.html">MapReduce</a>, <a href="http://www.michael-noll.com/wiki/Writing_An_Hadoop_MapReduce_Program_In_Python">possibles en Python</a> et <a href="http://blog.last.fm/2008/05/29/python-hadoop-flying-circus-elephant">automatisables grâce aux générateurs</a>, permettraient de récupérer directement du RDF en sortie. De plus, mes problèmes de confidentialité, pourraient être nativement pris en compte à ce niveau (?)</p>
  57. <h2>Mais on veut manipuler des ressources !</h2>
  58. <p>C'est génial d'avoir du RDF mais ce que l'on souhaite généralement manipuler est à un niveau plus élevé que l'on pourrait appeler <strong>RRM pour Resource RDF Mapping</strong>, c'est ce que fait par exemple <a href="http://www.openvest.com/trac/wiki/RDFAlchemy">RDFAlchemy</a> qui est le pendant à SQLAlchemy qui est un <abbr title="Object Relational Mapping">ORM</abbr> classique.</p>
  59. <p><em>J'ai essayé un moment de créer une API RESTful directement sur un TripleStore mais ça pose de toute façon ensuite un problème ergonomique car les utilisateurs manipulent nécessairement des ressources et non des triplets au final, cette abstraction est donc utile dans mon cas mais ça peut varier selon les usages.</em></p>
  60. <pre><code>Ressources sémantiques (objets Python)
  61. | RDFAlchemy
  62. |
  63. Données (RDF)
  64. | MapReduce + TODO
  65. |
  66. Données sérialisées (CouchDB, Hadoop, etc)
  67. </code></pre>
  68. <p>Une fois nos ressources définies, <strong>il faut maintenant un outil pour y accéder via une interface RESTful</strong>, c'est seulement ici que <a href="https://larlet.fr/david/biologeek/archives/20070501-developper-une-application-restful-avec-django/">Django entre en jeu</a>. J'aurais l'occasion d'en reparler car je suis en train de développer mon propre outil de vues afin de faciliter ceci (après avoir retourné dans tous les sens <a href="http://code.google.com/p/django-rest-interface/">django-rest-interface</a>, je ne suis pas totalement satisfait et le projet est mort).</p>
  69. <pre><code>Représentations standardisées (HTML, JSON, Atom, etc)
  70. | Django + TODO
  71. |
  72. Ressources sémantiques (objets Python)
  73. | RDFAlchemy
  74. |
  75. Données (RDF)
  76. | MapReduce + TODO
  77. |
  78. Données sérialisées (CouchDB, Hadoop, etc)
  79. </code></pre>
  80. <p>Vous pouvez terminer le millefeuilles en connectant un site, un widget ou votre <abbr title="Rich Internet Application">RIA</abbr> sur cette API qui est évidemment buzzword compliant (le titre original était « Architecture Foutaises! » mais j'avais peur que ce soit encore interprété comme un gros troll).</p>
  81. <pre><code>Utilisations (site, widget, RIA, etc)
  82. | REST/APP
  83. |
  84. Représentations standardisées (HTML, JSON, Atom, etc)
  85. | Django + TODO
  86. |
  87. Ressources sémantiques (objets Python)
  88. | RDFAlchemy
  89. |
  90. Données (RDF)
  91. | MapReduce + TODO
  92. |
  93. Données sérialisées (CouchDB, Hadoop, etc)
  94. </code></pre>
  95. <h2>Et pour quelques threads de plus...</h2>
  96. <p>J'en ai rapidement parlé lors de ma <a href="https://larlet.fr/david/biologeek/archives/20080521-conferences-django-pour-pycon-fr/">présentation de Django</a>, il est très important de pouvoir effectuer des tâches asynchrones lorsqu'elles pénalisent les performances de votre site et donc l'expérience utilisateur.</p>
  97. <p>Pour ça, <strong>Erlang semble former un <a href="http://humani.st/scalable-web-apps-erlang-python/">couple parfait</a> avec Python</strong> puisqu'il permet une parallèlisation à moindre coût, ainsi qu'un communication via HTTP+JSON. Ça tombe bien car c'est l'un des format qui est servi par notre interface RESTful en Django ! On pourrait aussi imaginer que les traitements asynchrones puissent accéder directement aux données RDF selon les cas.</p>
  98. <pre><code>Utilisations (site, widget, RIA, etc)
  99. | REST/APP
  100. |
  101. Représentations standardisées (HTML, JSON, Atom, etc)
  102. ↑ |
  103. | Django + TODO |
  104. | ↓
  105. Ressources sémantiques (objets Python) Traitements asynchrones (Erlang)
  106. ↑ ↑
  107. | RDFAlchemy |
  108. | |
  109. Données (RDF) ------------------------------/
  110. | MapReduce + TODO
  111. |
  112. Données sérialisées (CouchDB, Hadoop, etc)
  113. </code></pre>
  114. <p>Vous cumulez ainsi la rapidité de développement offerte par Python (et Django) d'une part et les performances d'Erlang pour les travaux demandant un certain temps. <strong>Le meilleur des deux mondes.</strong></p>
  115. <h2>Quelques inconvénients évidents</h2>
  116. <p><strong>À chaque mapping, on perd en performances</strong> et là on fait Document → RDF → Resource → Représentation ce qui fait quand même quelques étapes... bien sûr <strong>on gagne en standardisation et en pérennité</strong>, il sera possible de changer d'outils, voire de supprimer certaines transitions plus tard lorsque les avancées technologiques suivront. <strong>C'est le coût de l'agilité</strong> et à ce stade il serait difficile d'estimer si c'est vraiment pénalisant au final.</p>
  117. <p>Le problème des outils innovants, c'est qu'ils <strong>manquent d'extensions et/ou n'ont aucun benchmark</strong> permettant de valider un choix compte tenu du nombre de données estimées. De plus, coder chaque lib inexistante à la main est assez fastidieux et je trouve plus intéressant de consacrer mon temps à réfléchir au produit final.</p>
  118. <p>Enfin, ça demande de <strong>maîtriser un bon nombre de technos</strong>, je suis en train d'apprendre Erlang pour compléter mon arsenal mais plus le domaine des compétences s'étend et plus vous perdez en efficacité, ça peut être préjudiciable si vous travaillez seul. Ou pas, si vous êtes un geek curieux :-).</p>
  119. <p>À ce stade de ma réflexion c'est ce qui me semble le plus pertinent mais je suis loin d'être un expert sur la question. Idées et retours d'expériences bienvenus, comme toujours.</p>
  120. </div>
  121. </article>
  122. <footer>
  123. <h6 property="schema:datePublished">— 04/06/2008</h6>
  124. </footer>
  125. </section>
  126. <section>
  127. <div>
  128. <h3>Articles peut-être en rapport</h3>
  129. <ul>
  130. <li><a href="/david/biologeek/archives/20081008-critique-du-livre-designing-obvious/" title="Accès à Critique du livre Designing the obvious">Critique du livre Designing the obvious</a></li>
  131. <li><a href="/david/biologeek/archives/20080811-rdf-adn-de-notre-identite-numerique/" title="Accès à ★ RDF, l&#39;ADN de notre identité numérique ?">★ RDF, l&#39;ADN de notre identité numérique ?</a></li>
  132. <li><a href="/david/biologeek/archives/20080716-differences-entre-identification-autorisation-et-authentification/" title="Accès à Différences entre identification, autorisation et authentification">Différences entre identification, autorisation et authentification</a></li>
  133. </ul>
  134. </div>
  135. </section>
  136. <section>
  137. <div id="comments">
  138. <h3>Commentaires</h3>
  139. <div class="comment" typeof="schema:UserComments">
  140. <p class="comment-meta">
  141. <span class="comment-author" property="schema:creator">Mat</span> le <span class="comment-date" property="schema:commentTime">04/06/2008</span> :
  142. </p>
  143. <div class="comment-content" property="schema:commentText">
  144. <p>Desole c&#39;est peut etre un peu HS :<br />En parlant de MapReduce/Hadoop, je trouve le principe genial mais j&#39;ai du mal a voir concretement dans quel cas de figure on peut l&#39;utiliser dans des applis web classiques.</p>
  145. <p>Serait-il envisageable de faire un billet avec des exemples d&#39;utilisation possibles ? (ex: en partant de services web classiques, voir quelles parties pourraient etre deleguees a des taches MapReduce).</p>
  146. <p>Enfin merci pour tes articles de tres bonne qualite, j&#39;ai pas encore eu l&#39;occaz de le dire :)</p>
  147. </div>
  148. </div>
  149. <div class="comment" typeof="schema:UserComments">
  150. <p class="comment-meta">
  151. <span class="comment-author" property="schema:creator">Olivier</span> le <span class="comment-date" property="schema:commentTime">04/06/2008</span> :
  152. </p>
  153. <div class="comment-content" property="schema:commentText">
  154. <p>Tu ne dispenserais pas par hasard des formations orientées sémantique dont RDF ? ou si tu en connais, je suis intéressé.</p>
  155. <p>Merci pour l&#39;article !</p>
  156. </div>
  157. </div>
  158. <div class="comment" typeof="schema:UserComments">
  159. <p class="comment-meta">
  160. <span class="comment-author" property="schema:creator">Yoan</span> le <span class="comment-date" property="schema:commentTime">04/06/2008</span> :
  161. </p>
  162. <div class="comment-content" property="schema:commentText">
  163. <p>Personnellement j&#39;enlèverais « Données RDF » qui sont à mon sens un format d&#39;échange et pas de travail, surtout en connaissant le princip de “leaky abstraction” et là il y en a dans trois cas -&gt;<br /> - stockage (CouchDB, HDFS, Mnesia, SimpleDB);<br /> - ressources Python<br /> - traitement asynchrones (Erlang?)</p>
  164. <p>Données RDF est en entrée et sortie du stockage mais de l&#39;autre côté, l&#39;application interne travaillant avec son abstraction choisie. Ça n&#39;est pas très RDF-friendly, mais je peine à concevoir l&#39;autre cas comme étant viable (pour avoir joué avec ActiveRDF qui fait un mapping OO sur RDF).</p>
  165. <p>La force d&#39;Erlang est le fait que tu puisses créer 10&#39;000 instances distribués sur toutes tes machines en un claquement de doigt et qu&#39;ils puissent tous communiquer entre eux simplement ensuite. Si tu n&#39;as pas la notion de distribution (le map/reduce de CouchDB) ou d&#39;évènementiel (le chat de Facebook pour ne citer que lui), je n&#39;en vois pas bien l&#39;usage.</p>
  166. <p>Garde le pour faire ton système de notifications, un système de crawling/ping, des queues de traitement, voire même ton API JSON/REST/SOAP (biffez l&#39;intru).</p>
  167. <p>Donc oui, je suis contre mais l&#39;idée d&#39;une killer-app est intéressante. J&#39;avais pensé à un système de bookmarks, car il y a plétore d&#39;ontologies qui peuvent servir et le modèle est assez simple (FOAF + SIOC + SKOS + DC) Si ça t&#39;inspire ? J&#39;ai un bout de doigt à dédier à l&#39;idée.</p>
  168. <p>-- Yoan</p>
  169. <p>PS: nous sommes en &quot;june&quot; chez moi et saidoublementmal : français + anglais = impression bizarre, le mois de juin est en l&#39;honneur de la déesse romaine Junon (Juno en anglais, superbe film d&#39;ailleurs) et de ce fait prend la majuscule de rigueur en anglais.</p>
  170. </div>
  171. </div>
  172. <div class="comment" typeof="schema:UserComments">
  173. <p class="comment-meta">
  174. <span class="comment-author" property="schema:creator">Damien B</span> le <span class="comment-date" property="schema:commentTime">04/06/2008</span> :
  175. </p>
  176. <div class="comment-content" property="schema:commentText">
  177. <p>&quot;laisse aujourd&#39;hui généralement place au modèle structuré et distribué&quot;</p>
  178. <p>On aurait préféré un lien vers une référence plutôt que juste une mise en gras :-)<br />D&#39;autre part, la dernière fois que j&#39;ai regardé CouchDB, Hadoop et BigTable, ils travaillaient tous sur un modèle clef + valeur sans schéma. Ce n&#39;est pas franchement ce que j&#39;appelle un modèle structuré :-)</p>
  179. <p>&quot;d&#39;où le problème lorsqu&#39;on essaye de construire une application RESTful qui tape directement sur des triplets RDF&quot;</p>
  180. <p>Parler de triplet RDF, c&#39;est déjà se restreindre à une formalisation possible d&#39;un graphe. Mais en fonction de la complexité est de la structure de ton graphe, le triplet n&#39;est pas forcément la représentation la plus pertinente.</p>
  181. <p>&quot;Personnellement j&#39;enlèverais « Données RDF » qui sont à mon sens un format d&#39;échange&quot;</p>
  182. <p>Mais RDF n&#39;est pas un format ! RDF-XML est un format, N3 est un format. RDF est un modèle relationnel dans lequel (entre autre) l&#39;association est systématiquement qualifiée, contrairement aux modèles proposés par les SGDBR standard, où la qualification de l&#39;association se &quot;retrouve&quot; matérialisée par un attribut de l&#39;entité.</p>
  183. </div>
  184. </div>
  185. <div class="comment" typeof="schema:UserComments">
  186. <p class="comment-meta">
  187. <span class="comment-author" property="schema:creator">Christian Fauré</span> le <span class="comment-date" property="schema:commentTime">04/06/2008</span> :
  188. </p>
  189. <div class="comment-content" property="schema:commentText">
  190. <p>Hello David, et merci d&#39;avoir si bien continué la discussion, également à Yoan et Damien pour leur éclairage :-)<br />Quelques remarques en passant :<br />- j&#39;ai eu une petite discussion avec Gautier (<a href="http://www.lespetitescases.net">http://www.lespetitescases.net</a>) précisément sur les différents modes de stockage RDF d&#39;où il ressort qu&#39;aujourd&#39;hui, et pour encore un bon moment, c&#39;est le triple Store sur une base relationnelle qui donne le plus de satisfactions (Got va publier un bench de Virtuoso allant jusqu&#39;à 3 milliards de triples effectués dans le cadre d&#39;un projet)<br />- il semble que le problème des conlumn store à la Hadoop soit leur inadaptation face à des requêtes hétérogènes/complexes (or c&#39;est souvent ce pourquoi on met en place du RDF). Par contre si ton appli a des requêtes pas trop complexes, ç&#39;est plus adapté.<br />-Concernant les GUIs j&#39;ai la conviction qu&#39;il y a de grandes choses à faire car nos interfaces utilisateurs actuelles sont souvent le masque de l&#39;architecture des données en mode relationnel.</p>
  191. <p>Moralité : si on change le moteur il va falloir changer la carrosserie. En tout cas çà fait du bien de partir depuis les données elles-mêmes :-)</p>
  192. </div>
  193. </div>
  194. <div class="comment" typeof="schema:UserComments">
  195. <p class="comment-meta">
  196. <span class="comment-author" property="schema:creator">Got</span> le <span class="comment-date" property="schema:commentTime">04/06/2008</span> :
  197. </p>
  198. <div class="comment-content" property="schema:commentText">
  199. <p>Christian a déjà dit tout ce que je pouvais dire. Quelques précisions, alors :</p>
  200. <p>- L&#39;avantage de se baser sur une BDR pour stocker du triples RDF est de disposer en natif d&#39;un certain nombre de fonctionnalités (backup, gestion des transactions, système d&#39;indexations voire système de réplication et procédure stockée...).</p>
  201. <p>- Pour le bench, Christian a un peu exagéré (si peu ;-) ), puisqu&#39;il s&#39;agit de 2 milliards de triples, mais c&#39;est déjà très structurant :-) Je ne sais pas encore comment je vais diffuser ce bench, mais je le ferai d&#39;une manière ou d&#39;une autre.</p>
  202. <p>- @Olivier, en guise d&#39;intro, ce diaporama pourra peut-être t&#39;aider : <a href="http://www.slideshare.net/lespetitescases/a-la-dcouverte-du-web-smantique/">http://www.slideshare.net/lespetitescases/a-la-dcouverte-du-web-smantique/</a> (David, j&#39;espère que tu m&#39;excuseras le petit coup de pub). Il existe quelques formations payantes et sinon, tu peux assister au prochain semantic Camp, on essaye d&#39;y faire des intros aux technologies.</p>
  203. <p>- @Yoan, une petite question : en quoi RDF ne serait qu&#39;un format d&#39;échange et pas un format de travail ?? Comme l&#39;a dit Damien, ce n&#39;est pas un format, mais un modèle. Or, comment interroger en sparql si tes données ne sont pas stockées selon le modèle RDF, comment effectuer des inférences, comment exploiter toute la logique que tu as définie dans ton ontologie ? Il faut que le RDF soit stocké quelque part. Maintenant, il est vrai que peu importe que ce soit un column store, une BDR ou un triple store natif (l&#39;avantage de disposer d&#39;un modèle et non d&#39;un format !), l&#39;important est de pouvoir utiliser SPARQL et pouvoir faire au moins un peu d&#39;inférences. Le principe de RDF est bien de séparer la donnée elle-même de l&#39;application ce qui est l&#39;inverse de ta proposition, me semble-t-il ?</p>
  204. <p>- toujours pour Yoan : il existe déjà des systèmes de bookmarks utilisant les technologies du Web sémantique, par exemple : Semanlink, <a href="http://www.semanlink.net/sl/home">http://www.semanlink.net/sl/home</a> et gnizr, <a href="http://code.google.com/p/gnizr/">http://code.google.com/p/gnizr/</a></p>
  205. <p>- @David (quand même ;-) ) Un autre ORM pour RDF à garder à l&#39;oeil : Topaz, <a href="http://www.topazproject.org/">http://www.topazproject.org/</a> qui fonctionne avec Mulgara et Fedora (pas la distribution, le repository) et merci pour ce billet très complet.</p>
  206. <p>Finalement, j&#39;avais des choses à dire, désolé pour ce long commentaire !</p>
  207. </div>
  208. </div>
  209. <div class="comment" typeof="schema:UserComments">
  210. <p class="comment-meta">
  211. <span class="comment-author" property="schema:creator">Christian Fauré</span> le <span class="comment-date" property="schema:commentTime">04/06/2008</span> :
  212. </p>
  213. <div class="comment-content" property="schema:commentText">
  214. <p>Ah au fait, puisque tu regardes côté Erlang, il y a un repository special pour les applis en Erlang : <a href="http://www.erlang.org/documentation/doc-5.0.1/lib/mnesia-3.9.2/doc/index.html">http://www.erlang.org/documentation/doc-5.0.1/lib/mnesia-3.9.2/doc/index.html</a></p>
  215. </div>
  216. </div>
  217. <div class="comment" typeof="schema:UserComments">
  218. <p class="comment-meta">
  219. <span class="comment-author" property="schema:creator">David, biologeek</span> le <span class="comment-date" property="schema:commentTime">05/06/2008</span> :
  220. </p>
  221. <div class="comment-content" property="schema:commentText">
  222. <p>@Mat : j&#39;y réfléchis et merci :-)</p>
  223. <p>@Olivier : c&#39;est envisageable oui, par contre ça va me demander pas mal de temps de préparation !</p>
  224. <p>@Yoan : le gros avantage de garder l&#39;intermédiaire RDF (outre les arguments des commentaires précédents) est de pouvoir passer un jour (oui je suis optimiste) à une base dédiée à ça sans trop avoir à en pâtir.</p>
  225. <p>Quand je parle d&#39;Erlang c&#39;est effectivement pour traiter tout ce qui est crawling/notifications/etc.</p>
  226. <p>&gt; J&#39;ai un bout de doigt à dédier à l&#39;idée.</p>
  227. <p>Vu la qualité du doigt, je n&#39;hésiterais pas ;-)<br />Il faut que je me bouge là-dessus mais j&#39;ai d&#39;autres priorités actuellement.</p>
  228. <p>@Damien B : <br />&gt; On aurait préféré un lien vers une référence plutôt que juste une mise en gras :-)</p>
  229. <p><a href="http://labs.google.com/papers/bigtable.html">http://labs.google.com/papers/bigtable.html</a><br /><a href="http://hadoop.apache.org/core/docs/current/">http://hadoop.apache.org/core/docs/current/</a><br />Je n&#39;ai pas vraiment trouvé LE document qui permet vraiment de tout comprendre d&#39;un coup malheureusement.</p>
  230. <p>&gt; Parler de triplet RDF, c&#39;est déjà se restreindre à une formalisation possible d&#39;un graphe.</p>
  231. <p>Tout à fait, je voudrais m&#39;en tenir à ce choix car c&#39;est celui qui a été adopté par des personnes beaucoup plus compétentes que moi dans le domaine. Cela dit, la couche &quot;Données sérialisées&quot; permettrait justement d&#39;étendre le graphe derrière.</p>
  232. <p>@Christian Fauré : merci pour tes précisions.</p>
  233. <p>&gt; Concernant les GUIs j&#39;ai la conviction qu&#39;il y a de grandes choses à faire car nos interfaces utilisateurs actuelles sont souvent le masque de l&#39;architecture des données en mode relationnel.</p>
  234. <p>Tout à fait, tant que l&#39;on a du relationnel qui correspond au fonctionnel ça va mais il faut vraiment essayer de faire abstraction des données et des contraintes techniques pour approcher une interface utilisable par le commun des non-geeks.</p>
  235. <p>@Got : ne t&#39;excuse pas de commentaires aussi intéressants malheureux !</p>
  236. <p>J&#39;attends avec impatience ton bench car je trouve que c&#39;est quelque chose qui manque cruellement. À part un ou deux cas isolés et qui sont rapidement obsolètes, il n&#39;y a rien de suivi et pertinent.</p>
  237. <p>Je ne connaissais pas Topaz, par contre c&#39;est en Java...</p>
  238. <p>@Christian Fauré : oui je connaissais de nom, je n&#39;ai jamais eu le temps de m&#39;y intéresser plus que ça par contre, merci.</p>
  239. </div>
  240. </div>
  241. <div class="comment" typeof="schema:UserComments">
  242. <p class="comment-meta">
  243. <span class="comment-author" property="schema:creator">Luke Hoersten</span> le <span class="comment-date" property="schema:commentTime">05/06/2008</span> :
  244. </p>
  245. <div class="comment-content" property="schema:commentText">
  246. <p>I have no idea what you&#39;re site says. I tried to use Google to translate the French but it made little sense. Anyway, thanks for citing my website in regards to Erlang + Python!</p>
  247. </div>
  248. </div>
  249. <div class="comment" typeof="schema:UserComments">
  250. <p class="comment-meta">
  251. <span class="comment-author" property="schema:creator">Got</span> le <span class="comment-date" property="schema:commentTime">05/06/2008</span> :
  252. </p>
  253. <div class="comment-content" property="schema:commentText">
  254. <p>@David : Je me disais bien aussi que tu serais moins intéressé par Topaz (ces petites bêtes ne sont pas trop ma tasse de thé ;-) ). Pour les bench, j&#39;en avais relevé un certain nombre dans le billet suivant : <a href="http://www.lespetitescases.net/node/988">http://www.lespetitescases.net/node/988</a> (qui d&#39;ailleurs contient une référence qui pourrait intéresser Damien : &quot;The end of an architectural Era&quot;, <a href="http://www.mit.edu/people/dna/vldb07hstore.pdf">http://www.mit.edu/people/dna/vldb07hstore.pdf</a> ).</p>
  255. <p>Virtuoso fait l&#39;effort (à son avantage d&#39;ailleurs...) de publier régulièrement les résultats des benchmarks qu&#39;ils effectuent (la dernière livraison : <a href="http://virtuoso.openlinksw.com/blog/index.vspx">http://virtuoso.openlinksw.com/blog/index.vspx</a> et <a href="http://www.openlinksw.com/weblog/oerling/?id=1368">http://www.openlinksw.com/weblog/oerling/?id=1368</a>). AllegroGraph, aussi, je crois.</p>
  256. </div>
  257. </div>
  258. <div class="comment" typeof="schema:UserComments">
  259. <p class="comment-meta">
  260. <span class="comment-author" property="schema:creator">Damien B</span> le <span class="comment-date" property="schema:commentTime">05/06/2008</span> :
  261. </p>
  262. <div class="comment-content" property="schema:commentText">
  263. <p>@David<br />&quot;Je n&#39;ai pas vraiment trouvé LE document qui permet vraiment de tout comprendre d&#39;un coup malheureusement.&quot;</p>
  264. <p>On s&#39;est mal compris, la référence que j&#39;aurais souhaité avoir c&#39;était l&#39;étude de marché qui montrait que les SGBDR traditionnels avaient montrés leurs limites et *qu&#39;en conséquence* ils laissaient aujourd&#39;hui *généralement* leur place aux &quot;modèle (non-)structuré et distribué&quot; :-) Sinon pour comprendre BigTable et le reste, c&#39;est assez rapide : c&#39;est un BerkeleyDB-like distribué (après la façon dont l&#39;aspect distribution est géré, on s&#39;en tape, c&#39;est l&#39;objectif).</p>
  265. <p>@Christian Fauré</p>
  266. <p>&quot;Concernant les GUIs j&#39;ai la conviction qu&#39;il y a de grandes choses à faire car nos interfaces utilisateurs actuelles sont souvent le masque de l&#39;architecture des données en mode relationnel.&quot;</p>
  267. <p>Nooooooon !! Pas du MDA !! Pas çaaaaaaaaaa !!!</p>
  268. <p>@Got</p>
  269. <p>Tiens, je n&#39;avais pas suivi le lien à l&#39;époque sur le blog.<br />Concernant ce papier, on dirait des étudiants en zététique qui nous assène toutes leur morgue en n&#39;argumentant rien, et qui au final, nous refond le coup de MySQL 3 : <br />- &quot;Regardez, on est dix fois plus rapide, vous êtes obsolètes&quot;<br />- &quot;Oui, mais vous n&#39;avez pas ça, ça, ça et ça&quot;<br />- &quot;Mais c&#39;est parce que vous n&#39;en avez pas besoin ! Il faut être bête pour en avoir besoin ! Ce sont vos applications qui sont mal foutues !&quot;<br />On voit ce qu&#39;il en est devenu avec MySQL 5 (qu&#39;on peut toujours utiliser avec du MyISAM si effectivement on n&#39;a pas besoin de grand chose).<br />J&#39;espère qu&#39;il n&#39;a pas été publié dans une revue...<br />Exemple typique, sur la haute disponibilité :<br />&quot;A recent paper [LM06] argues that failover/rebuild is as efficient as redo log processing. Hence, there is essentially no downside to operating in this manner. In an HA world, one is led to having no persistent redo log, just a transient undo one. This dramatically simplifies recovery logic.&quot;</p>
  270. <p>Avec ce magnifique exemple de haute disponibilité, quand les câbles sous-marins ont été endommagés au large de Taïwan en janvier 2007, les entreprises en Chine qui auraient compté uniquement sur des hot-backups à l&#39;étranger se seraient retrouvées sérieusement embêtée avec cette stratégie. La haute disponibilité, c&#39;est que faire quand tout crashe ? Avec eux ça devient : que faire si j&#39;ai une ou deux machines en panne mais que tout le reste (alimentation électrique, réseau) tourne parfaitement ?</p>
  271. <p>Et un dernier extrait pour finir :<br />&quot;If one assumes a grid of systems with main memory storage, builtin high availability, no user stalls, and useful transaction work under 1 millisecond, then the following conclusions become evident&quot;</p>
  272. <p>Si on considère un réseau d&#39;usines avec des stocks infinis, une haute disponibilité des ouvriers et de la chaîne de production assurée, sans garantie de respect de délai d&#39;exécution, et où toutes les opérations utiles sont effectuées en moins d&#39;une seconde, alors les conclusions suivantes deviennent évidentes :<br />votre usine est à jeter.</p>
  273. <p>Donc oui, c&#39;est assez intéressant comme article, je me suis fait reprendre pour moins que ça pendant mes études :-)</p>
  274. <p>(oups, encore un pâté, désolé)</p>
  275. </div>
  276. </div>
  277. <div class="comment" typeof="schema:UserComments">
  278. <p class="comment-meta">
  279. <span class="comment-author" property="schema:creator">Damien B</span> le <span class="comment-date" property="schema:commentTime">05/06/2008</span> :
  280. </p>
  281. <div class="comment-content" property="schema:commentText">
  282. <p>Oh, j&#39;avais raté la fin :<br />&quot;Our current favorite example of this approach is Ruby-on-Rails. This system is the little language, Ruby, extended with integrated support for database access and manipulation through the “modelview-controller” programming pattern. Ruby-on-Rails compiles into standard JDBC, but hides all the complexity of that interface. Hence, H-Store plans to move from C++ to Ruby-on-Rails as our<br />stored procedure language.&quot;</p>
  283. <p>Ca me laisse sans voix.</p>
  284. </div>
  285. </div>
  286. <div class="comment" typeof="schema:UserComments">
  287. <p class="comment-meta">
  288. <span class="comment-author" property="schema:creator">David, biologeek</span> le <span class="comment-date" property="schema:commentTime">05/06/2008</span> :
  289. </p>
  290. <div class="comment-content" property="schema:commentText">
  291. <p>@Luke Hoersten : it&#39;s about a web architecture which handles semantic content (and scales), thanks for your post ;-)</p>
  292. <p>@Got : merci pour tous ces liens, un autre pour la route : <a href="http://www4.wiwiss.fu-berlin.de/benchmarks-200801/">http://www4.wiwiss.fu-berlin.de/benchmarks-200801/</a></p>
  293. <p>@Damien B : ton dernier commentaire me laisse dans le même état :|</p>
  294. <p>Concernant la preuve demandée, je n&#39;ai malheureusement aucun argument à avancer, c&#39;est plus une « intuition geek » résultant de mes lectures (pas très scientifique comme approche, je te l&#39;accorde).</p>
  295. </div>
  296. </div>
  297. <div class="comment" typeof="schema:UserComments">
  298. <p class="comment-meta">
  299. <span class="comment-author" property="schema:creator">Damien B</span> le <span class="comment-date" property="schema:commentTime">05/06/2008</span> :
  300. </p>
  301. <div class="comment-content" property="schema:commentText">
  302. <p>Je continue sur le PDF de Got, c&#39;est décidément une mine :<br />&quot;At this point SQL is a legacy language with many known serious flaws, as noted by Chris Date two decades ago [Dat84].&quot;</p>
  303. <p>&quot;[Dat84] Date, C. J. “A critique of the SQL database language.”In SIGMOD Record 14(3):8-54, Nov. 1984.&quot;</p>
  304. <p>PDF en question que vous pouvez trouver ici : <a href="http://www.cs.duke.edu/%7Ejunyang/courses/cps216-2003-spring/papers/date-1983.pdf">http://www.cs.duke.edu/~junyang/courses/cps216-2003-spring/papers/date-1983.pdf</a></p>
  305. <p>Papier écrit donc fin 83, basé sur &quot;X3H2 (American National Standards Database Committee) Draft Proposed Relational Database Language. Document X3H2-83-152(August 1983).&quot; et l&#39;état de l&#39;art (principalement PL/1 en langage hôte). Je n&#39;irais pas jusqu&#39;à dire que certains lecteurs ici n&#39;étaient pas nés à l&#39;époque, et d&#39;autres ne savaient pas encore lire :-) Mais quand même.</p>
  306. <p>Comme vous pourrez le voir partout, SQL est devenue une norme ANSI en 1986, et à connu des révisions majeures en 1992, 1999, 2003 et une autre révision est en cours. A l&#39;heure actuelle, je pense qu&#39;à peu près tous les SGBDR courants son compatible quasiment à 100% avec SQL-99.</p>
  307. <p>Et là est le problème, c&#39;est qu&#39;avec ma connaissance de SQL, il y a quand même une bonne moitié du document de [Dat84] à oublier. Certains points sont par ailleurs toujours valides et c&#39;en est d&#39;ailleurs toujours gonflant (comme de devoir repréciser les jointures alors que le SGBDR a déjà la définition de la foreign key dans laquelle on tape).</p>
  308. <p>Bref... ils se sont mis à 6 pour faire ce papier, et visiblement il n&#39;y en a aucun qui a été choqué de baser leurs critiques majeures de SQL sur un papier d&#39;il y a bientôt 25 ans, alors que SQL n&#39;était pas normalisé à cette époque, et à connu trois révisions majeures entre (dont une pas vraiment encore assimilée il faut l&#39;admettre), et surtout sans émettre le moindre avis critique là-dessus : &quot;At this point SQL is a legacy language with many known serious flaws, as noted by Chris Date two decades ago [Dat84].&quot; C&#39;est proprement hallucinant ce niveau de bâclage.</p>
  309. <p>Je reprendrais le titre et le sous-titre :<br />&quot;The End of an Architectural Era&quot;</p>
  310. <p>Oui, c&#39;est la fin de l&#39;époque où les papiers a priori destinés à publication étaient architecturés correctement.</p>
  311. <p>&quot;(It’s Time for a Complete Rewrite)&quot;<br />Parfaitement d&#39;accord ! Qu&#39;ils refassent leur torchon ! Ca devrait aller vite à 6.</p>
  312. <p>Merci Got pour cette référence :-D</p>
  313. </div>
  314. </div>
  315. <div class="comment" typeof="schema:UserComments">
  316. <p class="comment-meta">
  317. <span class="comment-author" property="schema:creator">David, biologeek</span> le <span class="comment-date" property="schema:commentTime">09/06/2008</span> :
  318. </p>
  319. <div class="comment-content" property="schema:commentText">
  320. <p>@Damien B : tu devrais leur écrire, en prenant des pincettes, mais ton avis est plus que pertinent...</p>
  321. </div>
  322. </div>
  323. <div class="comment" typeof="schema:UserComments">
  324. <p class="comment-meta">
  325. <span class="comment-author" property="schema:creator">Damien B</span> le <span class="comment-date" property="schema:commentTime">09/06/2008</span> :
  326. </p>
  327. <div class="comment-content" property="schema:commentText">
  328. <p>Ecrire à 4 mecs du MIT et un de Microsoft ? Ils ont le pognon pour payer des relecteurs :-) Autant laisser ce papelard dans l&#39;oubli...</p>
  329. </div>
  330. </div>
  331. <div class="comment" typeof="schema:UserComments">
  332. <p class="comment-meta">
  333. <span class="comment-author" property="schema:creator">Yoan</span> le <span class="comment-date" property="schema:commentTime">11/06/2008</span> :
  334. </p>
  335. <div class="comment-content" property="schema:commentText">
  336. <p>Tout à fait, avoir de l&#39;inférence est important, c&#39;est clair. J&#39;ai juste un peu tendance à croire ce que je vois, et il me reste à explorer donc.</p>
  337. </div>
  338. </div>
  339. <div class="comment" typeof="schema:UserComments">
  340. <p class="comment-meta">
  341. <span class="comment-author" property="schema:creator">mapson</span> le <span class="comment-date" property="schema:commentTime">22/06/2008</span> :
  342. </p>
  343. <div class="comment-content" property="schema:commentText">
  344. <p>&gt; Dans l&#39;idéal, il faudrait avoir une base performante qui soit développée spécifiquement pour stocker du RDF</p>
  345. <p>AllegroGraph de Franz Inc correspond exactement à cette description. La version Free est limitée à 50 000 000 de triplets, ce qui semble suffisant pour la tester. Je n&#39;ai pas trouvé de tarif pour la version illimitée.</p>
  346. <p><a href="http://agraph.franz.com/allegrograph/">http://agraph.franz.com/allegrograph/</a></p>
  347. <p>Ils ont d&#39;ailleurs d&#39;autres produits pour le web sémantique (en Common Lisp).</p>
  348. <p>Personnellement, je ne crois pas trop aux promesses d&#39;un web sémantique. J&#39;ai l&#39;impression qu&#39;il force l&#39;utilisateur à se plier aux contraintes de l&#39;ordinateur au lieu de l&#39;inverse, par exemple en le forçant à renseigner des méta-données genre Dublin Core (et à le faire correctement, ce qui n&#39;est pas à la portée de tout le monde) pour faciliter le travail des moteurs de recherche.</p>
  349. </div>
  350. </div>
  351. <div class="comment" typeof="schema:UserComments">
  352. <p class="comment-meta">
  353. <span class="comment-author" property="schema:creator">NicolasChauvat</span> le <span class="comment-date" property="schema:commentTime">27/02/2009</span> :
  354. </p>
  355. <div class="comment-content" property="schema:commentText">
  356. <p>David, est-ce que tu pourrais mettre de côté un instant ton penchant naturel pour les langages de template et accepter de regarder plus en détail <a href="http://www.cubicweb.org">http://www.cubicweb.org</a> ? L&#39;architecture que tu décris est proche de celle que je t&#39;ai présentée lors de pycon-fr il y a bientôt un an. Nous la développons depuis 2001. Elle marche déjà. Evidemment c&#39;est un peu moins drôle que de tout refaire et ce n&#39;est pas du django-que-tu-aimes, mais tu aurais de quoi jouer: c&#39;est du Python, du twisted, ça utilise des données stockées dans des bases SQL, LDAP, subversion, etc. Elle est téléchargeable sous licence LGPL... allez, un bon geste ;)</p>
  357. </div>
  358. </div>
  359. <div class="comment" typeof="schema:UserComments">
  360. <p class="comment-meta">
  361. <span class="comment-author" property="schema:creator">David, biologeek</span> le <span class="comment-date" property="schema:commentTime">01/03/2009</span> :
  362. </p>
  363. <div class="comment-content" property="schema:commentText">
  364. <p>@NicolasChauvat : alors j&#39;ai pris le temps de regarder en détail et déjà le premier point bloquant c&#39;est la doc. Je ne peux pas miser sur un framework (aussi puissant soit-il) qui dispose d&#39;aussi peu de doc.</p>
  365. <p>C&#39;est pas forcément pour la doc car je pourrais aller me plonger dans le code mais ça signifie que la communauté est réduite et malgré ses années d&#39;avance le framework n&#39;évoluera pas assez vite car la barrière d&#39;entrée est trop élevée pour qu&#39;il y ait de nouveaux utilisateurs.</p>
  366. <p>Bon je fais abstraction du HTML dans du Python mais ça me donne des boutons :)</p>
  367. <p>Passons à RQL, je lis dans la FAQ : « Except that SPARQL did not exist when we started the project. Having SPARQL has a query language has been in our backlog for years. »</p>
  368. <p>Ça reste quand même un atout clé pour moi et je trouve dommage que cette migration à SPARQL n&#39;ait pas eu lieue depuis *des années* (et on revient au point sur le manque d&#39;utilisateurs).</p>
  369. <p>Enfin ça me semble assez éloigné de l&#39;architecture que j&#39;ai proposé (ou alors je n&#39;ai pas trouvé le store RDF). Et si c&#39;est pour le développer, on revient à « c&#39;est un peu moins drôle que de tout refaire ».</p>
  370. </div>
  371. </div>
  372. <div class="comment" typeof="schema:UserComments">
  373. <p class="comment-meta">
  374. <span class="comment-author" property="schema:creator">NicolasChauvat</span> le <span class="comment-date" property="schema:commentTime">15/03/2009</span> :
  375. </p>
  376. <div class="comment-content" property="schema:commentText">
  377. <p>Au moins tu as regardé... bon, je suppose que quand tu dis qu&#39;il n&#39;y a pas assez de doc, c&#39;est que <a href="http://www.cubicweb.org/doc/en/">http://www.cubicweb.org/doc/en/</a> ne te suffit pas, ce qui est compréhensible si on compare à la quantité de doc des projets qui ont déjà une large communauté.</p>
  378. <p>Pour ce qui est de SPARQL, il est probable que cela arrive dans les deux prochains mois, même s&#39;il n&#39;est pas prévu que SPARQL remplace RQL à l&#39;intérieur de la plate-forme.</p>
  379. <p>Pour ce qui est des langages de template, rien n&#39;empêche d&#39;en utiliser, c&#39;est juste que ça ne fait que compliquer les choses à mon avis. Plusieurs développeurs en discutent et font des essais qvec du python qui génère du HTML (dans le genre de ce qui se fait avec lxml), on verra quelle sera leur conclusion.</p>
  380. <p>Pour la base de triplets RDF, tu peux essayer Jena, puis comparer avec <a href="http://www4.wiwiss.fu-berlin.de/bizer/d2r-server/">http://www4.wiwiss.fu-berlin.de/bizer/d2r-server/</a> et constater que dans un cas ce n&#39;est pas aussi efficace que du relationnel et que dans l&#39;autre il manque de quoi faire une interface web facilement.</p>
  381. <p>Je suis surpris que tu n&#39;aies pas vu la similitude entre ce que tu te proposes de faire et ce qui existe déjà. Es-tu certain d&#39;avoir lu <a href="http://www.cubicweb.org/doc/en/A030-foundation.en.html#concepts">http://www.cubicweb.org/doc/en/A030-foundation.en.html#concepts</a> ? Peut-être que la documentation n&#39;est pas assez claire sur l&#39;architecture de la plate-forme.</p>
  382. <p>* Utilisations (site, widget, RIA, etc) - REST/APP - cubicweb peut servir de bdd (serveur) ou de service web ou d&#39;application RIA.<br />* Représentations standardisées (HTML, JSON, Atom, etc) - existe dans CubicWeb, grâce à la notion de vue applicable aux objets qui respectent une interface.<br />* Ressources sémantiques (objets Python) - existe dans CubicWeb, qui dispose d&#39;objets pour toutes les entités définies dans le modèle de données. <br />* Traitements asynchrones (Erlang) - existe dans CubicWeb, qui utilise Twisted.<br />* RDFAlchemy - dans CubicWeb, c&#39;est un ORM qui utilise RQL comme langage d&#39;interrogation.<br />Données (RDF) - dans CubicWeb, c&#39;est une bonne vieille base de données relationnelle qui peut être vue, grâce à RQL, comme un ensemble de triplets.<br />* CouchDB, Hadoop, etc - il n&#39;est pas encore possible d&#39;utiliser ces bases avec CubicWeb, mais le serveur sait déjà interroger plusieurs sources de données et fusionner les résultats, il est donc envisageable de rajouter des pilotes pour ces bases.</p>
  383. <p>Pour la taille communauté, c&#39;est la poule et l&#39;oeuf, mais j&#39;ai bien compris que tu ne feras pas partie des premiers à l&#39;adopter :)</p>
  384. <p>Bon courage pour tes développements et à bientôt.</p>
  385. </div>
  386. </div>
  387. </div>
  388. </section>
  389. <footer>
  390. <nav>
  391. <p>
  392. <small>
  393. Je réponds quasiment toujours aux <a href="m&#x61;ilto:d&#x61;vid%40l&#x61;rlet&#46;fr" title="Envoyer un email">emails</a> (<a href="/david/signature/" title="Ma signature actuelle avec possibilité de chiffrement">signés</a>) et vous pouvez me rencontrer à Montréal. <span class="more-infos">N’hésitez pas à <a href="/david/log/" title="Être tenu informé des mises à jour">vous abonner</a> pour être tenu informé des publications récentes.</span>
  394. </small>
  395. </p>
  396. </nav>
  397. </footer>
  398. </div>
  399. <script src="/static/david/js/larlet-david-3ee43f.js" data-no-instant></script>
  400. <script data-no-instant>InstantClick.init()</script>
  401. </body>
  402. </html>