title: Histoires de données slug: histoires-donnees date: 2016-03-21 chapo: La libération des algorithmes passera par la documentation de leurs données et de leurs finalités.
Pour Daniel Le Métayer, les informaticiens doivent s’interroger pour améliorer cette situation. La transparence ne peut se résoudre par la publication du code source d’un programme. Ça serait utile, mais ça n’aiderait pas grand monde. Expliciter le mode opératoire détaillé d’un logiciel également. L’important est de documenter les données qu’il exploite en entrée. Quelles données sont prises en compte, et quels sont leur incidence, leur impact ? Quels sont les critères qui jouent favorablement ou défavorablement lors d’une demande de prêt par exemple ? Il est nécessaire d’extraire les traits distinctifs de leurs fonctionnements pour permettre à tous de mieux les apprécier.
[…]
Pour Antoinette Rouvroy, l’enjeu n’est pas d’exiger la transparence du code, mais celle des finalités, pour autant qu’elles ne se réduisent pas à de la communication commerciale. Ainsi nombre d’algorithmes ont pour finalité d’améliorer l’expérience utilisateur d’un site. Mais cette raison n’est pas une explication suffisante : améliorer l’expérience utilisateur signifie le plus souvent chercher à vous faire rester plus longtemps sur le site ou vous pousser à consommer. Pour bien des sites de commerce en ligne, l’enjeu n’est pas d’améliorer l’expérience, mais de faire du datapricing, c’est-à-dire de la tarification algorithmique.
[…]
C’est justement l’enjeu de l’accountability, rappelle Le Métayer, de l’idée de rendre des comptes, de la responsabilité ou de la loyauté des algorithmes. Si on a du mal à effectuer des contrôles a priori, il est nécessaire d’exiger que ceux qui possèdent des données, qui procèdent à des traitements aient des comptes à rendre sur la manière dont ils utilisent les données. Nous avons besoin d’imposer des règles contraignantes, comme nous le faisons sur les données financières ou les fichiers de police…
On parle beaucoup d’ouverture des algorithmes en ce moment, en particulier à travers l’ouverture du code des impôts (cache). Or il me semble que l’ouverture d’un algorithme est une première étape nécessaire mais loin d’être suffisante, lorsqu’on appose une licence ouverte sur un code on ne fait pas pour autant du logiciel libre, « juste » de l’Open-Source. C’est la compréhension des tenants et des aboutissants qui est intéressante, c’est l’historique des décisions qui ont conduit à la matérialisation informatique de ces choix. La libération des algorithmes passera par la documentation de leurs données et de leurs finalités.
C’est l’objet de mon travail : les algorithmes, il y a des gens qui les fabriquent. Et ces gens qui les fabriquent ne le fabriquent pas pour rien - la mesure d’efficacité qui est au bout dépend d’une intention initiale. Une partie du travail que peut faire l’anthropologie ou la sociologie des algorithmes, la sociologie des algorithmes, c’est d’essayer de comprendre quelle est la vision du monde, les représentations, que se sont données ceux qui les fabriquent pour que le calcul d’efficacité à la fin produise tel ou tel genre de résultat.
Je pense que le format des *User Stories* :
En tant que , je veux afin de .
ou leur évolution que je préfère les Job Stories (cache) qui se base sur une situation plus qu’un profil :
Lorsque , je veux , pour pouvoir .
nous donne un formalisme que l’on pourrait réutiliser pour documenter ces algorithmes. Les Data Stories pourraient prendre cette forme :
Avec , je veux , afin de .
Ce qui donnerait par exemple :
Avec les 20 dernières interactions de l’utilisateur,
je veux personnaliser sa timeline
afin de rendre sa lecture plus pertinente.
Cela demanderait à être davantage détaillé pour être pertinent mais ça donne déjà une idée, imaginons maintenant que la publication de ces histoires soit un avantage compétitif pour un service qui a plus à gagner à divulguer sa logique aux utilisateurs qu’à la cacher à la concurrence. Imaginons une société où la transparence et la co-construction des algorithmes génèrent suffisamment de valeur pour que cela devienne un modèle d’affaires.
À quand des Conditions Générales de Transformation de la Donnée ? Dans quelle mesure est-ce que ces conditions s’intègrent dans un code social ? La responsabilité des développeurs ne devrait-elle pas être davantage partagée ?