★ Discussions sur les applications web libres

vignette

Je vais essayer de résumer ce que j'ai dit en introduction des discussions que j'ai eu lors des RMLL (en juillet) et de Paris Web (en octobre) autour de ce thème. Je vous accorde qu'il eut été beaucoup plus intéressant d'avoir les discussions en elles-même mais il faut bien qu'il reste un intérêt à venir ;-). Et puis je vous invite à continuer en commentaires.

Note : billet rédigé en partie dans le train donc ça va manquer de liens.

Notion de datacide

Point Commun

Le point commun entre Pownce, Ma.gno.lia ou Orange blogs est le suivant : une fermeture du service entraînant dans la majorité des cas la perte des données pour l'utilisateur (ou sa réutilisation impossible, je ne parle pas des geeks), ce que j'ai appelé un datacide par contraction de data et génocide, une extinction de données (mais alors la perte d'un nom de domaine est un crime contre le Web, argh :-)).

GMail outage

Or ce n'est malheureusement pas un cas isolé et on se rend même compte que la majorité des applications web 2.0 n'ont pas duré très longtemps...

Évolution du Web 2.0

Mais les disparitions brutales ne sont pas les seuls moments qui peuvent mettre en péril vos données, comment faites-vous lorsqu'un service est racheté par une entreprise à laquelle vous ne souhaitez pas livrer vos données personnelles ?

Rachat de Dopplr par Nokia

Toutes ces situations sont actuellement possibles du fait de l'enfermement des données dans des silos/prisons 2.0 qui ont la main sur vos données et qui en contrôlent l'accès, la réutilisation, la monétisation, etc.

Silos/prisons 2.0

Applications web libres

Si on analyse l'évolution du desktop, on a eu le développement à partir d'un système, l'OS, des logiciels qui ont fini par être libérés mais un peu sur le tard ce qui a donné une longueur d'avance difficilement rattrapable par le libre.

Évolution desktop/web

Si on passe maintenant au système web, on peut constater avec effroi que l'histoire se répète et c'était justement l'objet de mes interventions : motiver les développeurs pour une libération du web et de ses utilisateurs. Ou pour parler plus pragmatiquement, des données et de leur valorisation.

Est-ce déjà perdu vu l'avance de certains acteurs ? Je ne vous cache pas que c'est assez mal parti, mais rien n'est perdu car les habitudes ne sont pas encore assez ancrées pour être irréversibles, notre fidélité aux applications web est encore relativement faible (par exemple, il y a beaucoup moins de trolls sur les environnements web que sur les OS encore aujourd'hui, on a les indicateurs qu'on mérite :p).

J'aurais pu m'arrêter là et commencer la discussion mais je voulais poser quelques bases pour l'amorcer. C'est toujours difficile de savoir qui en est où dans l'assistance avant de lancer le débat. Avec le recul, je trouve ce format vraiment intéressant et je pense que j'essayerais de le reproduire.

Quelques pistes de discussion

Architecture et matériel

Architecture

Internet est intrinsèquement pair à pair et acentré (différent de décentralisé : qui possédait un centre). Or nos connexions asymétriques découragent une telle pratique qui consisterait à rendre chaque machine un serveur potentiel. C'est en partie la raison de l'échec d'Opera Unite par exemple qui a dû placer un proxy de cache pour limiter les faiblesses du réseau, ce qui lui a valu une mauvaise publicité injustifiée dans ce domaine (oui j'ai toujours ça en travers). Pourtant le concept est clairement innovant et permettrait de s'affranchir d'une nouvelle machine pour configurer un serveur local simplement (voir plus bas).

Opera Unite

On se retrouve ici à un goulot d'étranglement qui fait le bonheur de notre minitel 2.0 actuel : le téléchargement étant plus rapide, il a grandement contribué à la centralisation des services et aux producteurs de contenus professionnels qui ont les moyens de se payer un serveur avec une connexion décente.

Matériel

Partant de ce constant, il y a plusieurs alternatives matérielles possibles. On peut soit considérer qu'Internet est un nuage contrôlé par quelques sociétés et qu'il va falloir faire avec en développant des usages plus rapidement au détriment du contrôle de ses données. Je pense notamment à des projets comme JoliCloud qui sont tournés vers la mobilité mais qui renforcent cette architecture client/serveur qui n'est pas de l'Internet (vous pouvez mettre dans le même sac Chrome OS).

JoliCloud

Soit avoir son propre serveur maison qui permette d'héberger et de partager ses données. Les connexions asymétriques étant suffisantes pour un visiteur unique consultant les photos du dernier par exemple.

Benjamin Bayart était à l'Ubuntu Party ce weekend pour motiver des développeurs Ubuntu derrière un projet de no-box qui permettrait d'avoir la configuration d'un serveur web/mail/etc accessible aux humains. Même si c'est un premier pas important si on veut arriver à mettre un serveur libre dans chaque salon, je pense qu'il faut une forte culture web pour réussir à développer la couche applicative interopérable, ouverte, connectée, etc au dessus de la couche système. C'est la grande difficulté du projet et je suis bien placé pour le savoir car je me casse les dents sur l'aspect technique depuis 4 ans. Heureusement les choses commencent à bouger et de plus en plus de solutions sont envisageables.

Note : il est intéressant de constater la sortie récente d'un Mac mini avec Snow Leopard server qui couplé à MobileMe + un Web App Store (+ éventuellement une tablette) pourrait constituer une solution propriétaire/fermée mais au combien puissante...

Applications et indépendance

Applications

Cette couche applicative doit être aussi simple et ergonomique qu'un App Store des applications web (en plus ouvert, libre, mieux). Ça existe déjà avec LaDistribution par exemple qui est un projet au potentiel énorme.

LaDistribution

Mais cette solution va un peu trop loin à mon goût (même si elle a l'avantage d'être pragmatique). Idéalement, j'aimerais avoir un entrepôt de données auquel puissent accéder à la fois mes applications et des applications tierces qui valoriseraient ces données.

Par exemple Typepad Motion, développé par les ex-Pownce (en Django toujours), a libéré le code et vous permet pour le moment d'héberger les données sur Typepad, c'est une première tentative de séparation des données et des services dans le (ex-)monde du 2.0.

Typepad Motion

Il ne doit pas être très compliqué d'avoir une version qui pointe vers un autre stockage de données, ce qui m'intéresserait finalement beaucoup plus que la possibilité de contrôler le code mais non les données.

Indépendance

En effet, le point central d'une telle évolution est d'avoir une indépendance vis-à-vis du prestataire, je veux pouvoir changer d'hébergeur de mon entrepôt de données ou d'applications valorisant mes données sans que ce soit contraignant. Cette indépendance est rendu possible grâce à la possession d'un nom de domaine que l'on contrôle.

Cela éviterait également d'avoir une box dans son salon qui n'est pas super écolo et qui posera tôt ou tard la question de la neutralité du net lorsque les FAI auront compris qu'il y a un marché dans leurs box...

Identité et confiance

Identité

Il reste encore 2 gros problèmes irrésolus jusqu'à présent, mais relativement liés : la certification de l'identité et la confiance. L'impossibilité de pouvoir s'assurer de l'identité d'une personne sur ce nouveau continent qu'est le net est une réelle difficulté (je n'entre pas dans le débat c'est aussi une chance, etc). J'ai déjà évoqué ici la place clé des états ou banques dans ce processus mais ce ne sont pas vraiment des acteurs innovants et technophiles...

Évolution de l'identité

Une quantification de la confiance pourrait être établie par les réseaux sociaux mais les verified accounts de Twitter me font penser qu'il est difficile de déterminer ça algorithmiquement. Dommage que le W3C n'ait pas vraiment l'air de pousser la réflexion dans ce sens car ça va devenir un point clé et il serait dommage qu'il soit contrôlé par une/quelques société(s).

Discussions

De Google à FOAF+SSL, des points de vue juridiques aux points de vue ergonomiques, des concepts aux idées, de nombreux échanges ont suivi qui étaient sacrément intéressants. J'ai eu des retours assez positifs mais je crois que le plus ravi dans l'histoire, c'était moi, merci aux participants ! :-)

— 02/12/2009

Articles peut-être en rapport

Commentaires

Kévin Descoubes le 02/12/2009 :

petite erreur : "point comment" => "point commun", en début de phrase.

Effectivement, tu as bien repris tes slides de la conférence :).

J'avais commencé à aborder le sujet (troll pour certains) de Google Wave ... le débat est lancé :) !

Benoit Calvez le 02/12/2009 :

Rêve de geek 2 ?

Sincèrement, les "gens" ne veulent pas s'ennuyer à avoir leur propre serveur chez eux, tout ces services chez eux, d'ou cette décentralisation.

J'aimerai bien gérer mon identité dans ce web n'empêche.

Jérémie Ducastel le 02/12/2009 :

Une excellente introduction, la question de la libération/propriété des données est cruciale.

D'autant plus que j'aimerais, par exemple, avoir une recherche centralisée de toutes mes données personnelles (documents, signets, courriels, etc). Ce serait plus simple si je pouvais disposer d'un espace de stockage que je contrôle, une base à la couchdb par exemple et sur laquelle je pourrais faire pointer les différents services que j'utilise...

JmGilliot le 02/12/2009 :

Sympa cette présentation billet/diaporama ! et convaincante.

Je retiens l'idée de l'indépendance données - services - hébergeur. C'est effectivement sans doute le moyen de dépasser la tentation "toutes mes données chez moi" qui garantit certes l'indépendance mais pas la pérennité ou la mise à disposition large.

Sinon coté Box, je suis persuadé que nos FAI aient déjà conscience des capacités de tous ces équipements branchés 24/24, et alimentés par les utilisateurs eux-mêmes. Peut être faut-il penser à développer des box libres ?

Oncle Tom le 02/12/2009 :

Toujours très intéressant :-) On pourra te kidnapper pour les RMLL 2010 ? T'auras matière à parler ;-)

Damien B le 02/12/2009 :

"Cela éviterait également d'avoir une box dans son salon qui n'est pas super écolo"

Pas super écolo comparé à quoi ? Les box sont typiquement les équipements électroniques qui consomment le moins. Qu'une PS3 ou une XBox soit qualifiée de pas super écolo d'accord, mais pour les box, il faut préciser un peu :-) Parce que dans le "super écolo", tu vas trouver 240 gus qui conchient Nespresso et leurs capsules en alu, et tu vas retrouver les 240 mêmes qui vont baver devant le Mac unibody en alu, et qui vont aller en avion aux conférences sur le libre, avion fait principalement... en alu (sauf les derniers en composite, mais bon).

"et qui posera tôt ou tard la question de la neutralité du net lorsque les FAI auront compris qu'il y a un marché dans leurs box..."

Vu les campagnes de pub des FAI, qui ne parlent plus ni de débit, ni de dégroupage, ni de services internet (Free a d'ailleurs fermé sans tambour ni trompettes son service de proxy, à quand son relais news), je crois qu'ils ont compris que le point vendeur (le marché donc) était la box :-D

BAgar le 02/12/2009 :

"Parce que dans le "super écolo", tu vas trouver 240 gus qui conchient Nespresso et leurs capsules en alu, et tu vas retrouver les 240 mêmes qui vont baver devant le Mac unibody en alu, et qui vont aller en avion aux conférences sur le libre, avion fait principalement... en alu (sauf les derniers en composite, mais bon)."

Quel rapport ? L'aluminium se recycle très bien, quand on prends la peine de mettre en place des systèmes pour le collecter.

David, biologeek le 02/12/2009 :

@Kévin Descourbes : merci pour la faute, concernant Wave je ne suis pas persuadé que ce soit un outil qui permette d'aller dans ce sens. Ça encourage la collaboration, les échanges en temps réel et beaucoup d'autres choses et le protocole pourrait être une brique de cette vision mais il faudrait que tu précises ce que tu veux discuter :-)

@Benoit Calvez : oui, rêve de geek 2, disons plutôt qu'il évolue avec mes connaissances et centres d'intérêts.

@Jérémie Ducastel : la recherche va être un point clé oui dans une architecture distribuée, la découverte de localisation (je trouve pas le mot français pour ça) et la connectivité des applications sont essentielles pour rendre possible cette recherche.

@JmGilliot : il y a plusieurs initiatives suite à la conf de Benjamin qui sont listées sur http://www.suna.fdn.fr/globenet/no-box/cahier-charges mais aucune n'a aboutie.

@Oncle Tom : parler 2 fois de suite de la même chose c'est pas super pertinent dans notre microsystème mais ça m'intéresse toujours, on en parle demain soir ?

@Damien B : j'avais casé deux fois pragmatique dans le billet et je suis très déçu que tu n'aies pas réagi ;-)

Super écolo comparé à notre cher nuage qui permet de faire des économies d'échelle ou au moins de mutualiser certaines ressources. Après je suis bien d'accord avec toi sur les incohérences des pratiques écologiques au quotidien.

NiKo le 02/12/2009 :

OncleTom++, on serait ravi de te voir répandre la bonne parole en éveiller les consciences aux prochaines rmll :)

Heu, bon sinon, je vais pas trop me répéter sur le sujet mais :

- https://larlet.fr/david/biologeek/archives/20070131-reve-de-geek/#c7937
- https://larlet.fr/david/biologeek/archives/20090708-travail-sur-les-libertes-fondamentales-des-applications-web/#c49481
- https://larlet.fr/david/biologeek/archives/20090708-travail-sur-les-libertes-fondamentales-des-applications-web/#c49486

Et j'ajouterai juste que tant que ça sera pas aussi simple pour madame Michu de créer un profil FOAF+SSL qu'ouvrir un compte google, ben ça percera pas, datacides ou pas.

Neovov le 02/12/2009 :

Tu fais bien de faire un billet là dessus. J’avais préféré écouter le débat, très intéressant, à Paris-Web (et puis hein, j’suis timide et nul dans ce sujet).

Mais il y a des questions qui me turlupinent :
Je suis d’accord avec ta vision, il faut libérer les données, trouver un moyen *simple* pour permettre aux gens de partager leurs données avec la granularité qu’ils veulent. Mais, tant que ce n’est pas en complexifiant la démarche (typiquement, comme OpenID). J’ai peur que cette discussion ne tourne en rond à cause de notre connaissance du web. Beaucoup de gens n’y connaissent rien (ou plutôt, peu en connaissent beaucoup), et ce qui nous semble évident est forcément extrêmement compliqué pour des profanes.

Cette discussion amène à une autre vision du web, qui n’est déjà pas simple à imaginer ou concevoir, alors imaginez l’expliquer à quelqu’un d’autre… Ce qui me semble extrêmement important dans toute cette histoire c’est donc l’abstraction.

J’ai aimé Opera Unite pour la tentative. Passer par un proxy fait l’impasse sur la plateforme technique. Reste encore l’URL qui n’est, pour moi, pas la solution. C’est tout juste si les profanes font la relations entre une URL et un site, alors leurs faire comprendre que maintenant, une URL c’est plus que ça…

Le récent travail de Mozilla est prometteur là dedans (Weave et les concepts de FF4 il me semble), plutôt que de considérer le navigateur comme un simple navigateur, ils le considèrent comme le point d’entrée sur le web.

Plutôt que de s’identifier sur un site, on s’identifie dans son navigateur, et c’est le navigateur qui nous identifie sur le web. Allié à une liste d’ami et un équivalent d’Opera Unite on aurait quelque chose de vraiment magnifique, un web pair-à-pair (ou autre chose que du web…).

Dit comme ça je me dis qu’au final on a pas besoin de box, ou de serveur dans notre salon…

(Et je viens de remarquer que je n’ai posé aucune question…)

Jérémie Ducastel le 02/12/2009 :

Merci pour la correction de ma faute de frappe ;)

L'avantage du stockage "in the cloud" par rapport à un serveur local n'est pas seulement écologique ( = alimenter en continu une quantité bien plus réduite de machines) mais aussi pour la sécurité des données... Si mon appartement brûle, je ne veux pas perdre mes photos papier ET électroniques, par exemple.

Damien B le 02/12/2009 :

BAgar : "Quel rapport ? L'aluminium se recycle très bien, quand on prends la peine de mettre en place des systèmes pour le collecter."

Sauf qu'avant de recycler l'aluminium, il faut le produire, et le "bilan écologique" de la production n'est quand même pas terrible. Et sinon donc tu dis que la filière de recyclage des ordinateurs est plus au point que celles des capsules ? Ce n'est pas vraiment ce que je vois à ma déchetterie, ce qui ne montre qu'une chose, ça n'est pas universellement vrai :-)

David : traître, tu avais piégé ton texte ! Relisons.

David et Jérémie Ducastel : pour la sécurité des données, pour l'instant je n'ai jamais perdu des infos que je gérais directement, par contre dans le nuage, j'en ai déjà perdues oui (faux positifs noyés dans la masse des spams chez Gmail, données écrasées et enregistrement jamais effectués dans Google Calendar, les premiers sites web qui ont disparu quand le fournisseur a disparu, etc...), le nuage est beau, mais le nuage reste avec un support matériel :-)

Après pour les économies d'échelle, ça reste à calculer finement. La salle d'hébergement est climatisée en permance, pas ma box. Je n'ai pas de surcapacité outrageuse, mon nuage doit avoir de la surcapacité en permanence. Ma box est construite autour de composants basse consommation et basse performance, mon nuage ça reste à voir. Ma box est unique, alors que "mes données" (si j'étais un netizen complet qui met ses données dans tous les services à la mode) ne sont pas dans un nuage, ni deux, ni trois, mais une bonne dizaine : chacun garde sa copie. Un bon nuage est un nuage complètement redondant, dans au moins deux datacenters physiquement séparés. Le Nuage, avec un N majuscule, unique, géré par des personnes qui mettent l'efficacité énergétique en première ligne est un mythe. Au-delà du mythe, il faut calculer, finement :-)

quesh le 02/12/2009 :

@JmGilliot
un peu comme une fonera ?
http://demo.fon.com/luci/

Effectivement, il est temps de se ré-approprier ses données et pas seulement par principe.

Wilfried le 02/12/2009 :

Bonjour,
reflexion intéressante,
mais qu'en est-il des gens qui n'ont pas de connection internet illimité (comme c'est souvent le cas ici en amérique du nord), ou des gens qui n'ont pas l'électricité 24/24 chez eux, dans certains pays d'afrique par exemple ?

De plus un nouveau problème se pose, les entités qui redirigent vers les identitées et les données sont-elles des tiers de confiance ?

Il faut aussi penser a ceux qui ne veulent pas se soucier de la préservation, de la distribution et de l'utilisation de leurs données. (Il faut resté libre de ne pas l'être ;))

Kévin Descoubes le 02/12/2009 :

@David: tu m'avais déjà fait la remarque lors de la conférence : "tu parles de quoi ? du protocole, du client, du serveur ?"
(si si, rappelles toi)

Et donc voilà, je trouve juste que Google Wave est un principe qui a de l'avenir, et le fait qu'il soit "libre" peut encourager et aider au développement d'applications web libres !

xethorn le 03/12/2009 :

Merci pour la recap'. Le contenu est clairement interessant, riche en exemple. Autant dire que meme si j'ai pas pu voir en "vrai", la lecture fut un veritable regal :)

David, biologeek le 05/12/2009 :

@NiKo & Neovov : pour répondre à tes commentaires, il faut bien séparer les deux problèmes :

* celui des interfaces qui vont permettre à Mme Michu d'avoir accès à un tel système, c'est un point clé mais il est possible de rendre ces choses simples et ergonomiques à mon avis ;
* celui du contrôle des données et pour reprendre ton exemple de FlickR à Freebox, je pense qu'avoir un boîtier que l'on contrôle dans son salon n'est pas une utopie, toute la difficulté réside dans le fait de pouvoir changer de boîtier quand on veut grâce à une simple réplication des données.

Bien sûr on sera toujours dépendant de son registar, des DNS utilisé (Google n'investit pas là-dedans de manière anodine) mais c'est déjà bien meilleur à mon avis. C'est un travail de longue haleine mais progressivement...

@Jérémie Ducastel : mais en même temps, si le datacenter a un soucis, on arrive de toute façon à une situation de datacide si l'on n'a pas une politique de sauvegarde cohérente.

@Damien B : il faudrait effectivement calculer finement, mais il ne faut pas oublier qu'une solution écolo dans le domaine est liée aussi à des réductions de coûts de fonctionnement, ce qui est mon avis la composante qui pourrait transformer le mythe en réalité ;-).

@Wilfried : l'accès au réseau n'est pas égalitaire entre les pays, c'est une réalité. Toute tentative de réappropriation des données est à mon avis une chance pour ces pays qui dépendent actuellement des services principalement américains.

@Kévin Descoubes : je pense que je t'avais plutôt demandé si tu parlais de la plateforme, du produit ou du protocole (cf https://larlet.fr/david/biologeek/archives/20090605-google-wave-une-fois-la-vague-de-buzz-retombee/). Le protocole me semble être la piste la plus intéressante.

Est-ce que Wave va encourager le développement d'applications web libres ? Je n'en ai aucune idée, il y a des tas de technos libres qui n'ont juste pas été utilisées.

Damien B le 05/12/2009 :

David : "mais il ne faut pas oublier qu'une solution écolo dans le domaine est liée aussi à des réductions de coûts de fonctionnement"

Je propose la bibliothèque de prêts de livres, ça a un coût de fonctionnement bien inférieur à n'importe quel datacenter :-D

Bruno le 10/12/2009 :

Ce débat est très intéressant, constructif et rejoint vers une réflexion que je me faisais depuis que j'avais testé tous les derniers trucs a la mode: wave, wazabi entre autres.

Au début j'ai trouvé l'évolution vers un mode ou depuis mon PC, celui de mon pote, de mon téléphone, j'accède à mes mails, mes photos, mes amis, vraiment séduisante et intéressante.

Maintenant, je suis en temps réel au courant qu'une information m'est arrivée (wazabi par exemple), je peut la transmettre a tout un tas de gens très simplement.

Google avec Chrome OS fait le postulat qu'un PC c'est un browser web, que tout ce qu'on a besoin est disponible sur la toile, incluant ses datas.

Et la arrive un peu le mal de ventre et l'indigestion ... j'ai vraiment besoin de tout cas ? j'ai vraiment voulut tout ca ?

Je sens une dictature du machin qui gère mes mails, mes flux, mes datas. Si machin ne marche plus, si ma connexion vers machin ne fonctionne pas, comment on fait ?

Hier mon fils a joué sur mon PC avec un jeu qui venait de la bibliothèque, je n'avais pas le réseau. Il s'est bien amusé...

Bref tout ca pour dire, que ce soit la protection, l'accès, le stockage des ses données personelles, qu'a la possibilités de changer facilement de "visualisateurs".

Je pense que les utilisateurs vont à un moment devoir dire stop. Cela crée une trop grande dépendance avec l'hébergeur et une trop grande inégalité quand à l'accès à l'information.

Le postulat qu'on se dirige vers du cloud computing massif ne me semble vraiment pas établit.

J'espère qu'effectivement des initiatives vont arriver pour libérer les utilisateurs du système ou celui qui montre à la main sur les données.

Wait tests and and See (and/or particapte)

Bruno

Sinon depuis j'ai lut les commentaires de Niko dans les liens, je partage complétement sa vision