ArnO le 15/08/2006 :

Merci pour tes posts toujours tres reactifs et tres explicites.
Pour la construction de pages Web semantique je te conseil de te pencher sur KnoBot (wymiwyg.org/knobot). C'est un outil qui supporte le framework de developpement semantique Jena.
Pour ce qui est de la lutte entre RDF et methode de fainéants, je vote RDF. C'est le format de base dans ce cas. Et puis toutes les normes ne sont pas encore validees. Par exemple SPARQL, qui permettra de faire des requettes sur les fichiers RDF, a la maniere de SQL, n'est qu'une recommandation candidate du W3C.
C'est du tout frais, du tout nouveau, un peu de patience et tout ca ce mettra en place
Bon courage, ArnO

Xavier le 15/08/2006 :

Tu oublies une splendide chronique : www.clever-age.com/veille... ;-)

Je pense que tu fais fausse route dans ton interprétation de l'état actuel des choses : le Web sémantique existe, et si les "gros" comme Google ou Yahoo! semblent l'ignorer pour le moment, c'est parce que leur interêt ne s'y trouve pas (encore). Si les géantsmontraient toujours la voie de l'innovation, cela se saurait depuis bien longtemps.

Une manière de permettre au web de se "sémantiser" peu à peu, c'est de montrer aux entreprises les gains qu'elles peuvent avoir à utiliser le WS. Employer RDF comme support pour des échanges de données, cela a tout son sens aujourd'hui, surtout avec l'existence de nombreuses API de manipulation de RDF. Mais se borner à emloyer les microformats sans que cela s'inscrive dans une démarche de masse, cela ne mène a rien, au moins dans le monde de l'entreprise. Sémantiser pour sémantiser, cela ne sert à rien - ou tout au plus à faire hype. Par contre, utiliser les technologies du Web Sémantique pour répondre de manière efficace à des besoins et aller plus loin dans les possibilités, ça c'est cool !

Pour répondre à une question que tu poses, je dirais que pour "faire un site sémantique", il faut proposer une alternative sémantique à chacune des infiormations/contenus présentés sur ce site. Tout est bon : RSS 1.0 (RDF), variantes de RDf adaptées aux galeries photo, FOAF pour un CV, etc.

J'ai mis en place quelques mal d'outils autour de Symfony pour permettre de produire un site plus ou moins sémantque. Fais moi signe si ça t'intéresse ;-)

David, biologeek le 15/08/2006 :

@ArnO : j'ai jetté un œil au projet KnoBot et je ne voudrais pas m'arrêter à l'esthétique mais quand même être obligé de regarder la source d'une page pour lire l'intitulé du projet ça fait web 0.1 là...

Bon sinon le projet est bon, j'espère qu'on va arriver à l'utilisation du peer-to-peer pour décentraliser tout ça. À quand un moteur de recherche ;)

www.biologeek.com/journal...

@Xavier : je n'ai pas oublié cette chronique, mais je l'avais déjà liée dans l'article précédent :

www.biologeek.com/journal...

Mais bon, les bonnes chroniques on s'en lasse pas ;)

> Je pense que tu fais fausse route dans ton interprétation [...] le Web sémantique existe

Soit, je ne remet pas du tout en doute l'existence du web sémantique, c'est juste que j'ai du mal à estimer son ampleur. Combien de personnes ont déjà entendu parler de web sémantique ? Encore combien de temps avant sa démocratisation ?

Sinon pour la suite 100% d'accord. Ce que tu as fait pour Symfony est facilement adaptable à Django ? ;)

giz404 le 15/08/2006 :

Je me suis déjà penché sur ces aspects... mais il en ressort un petit goût d'à-quoi-bon.

Cela prend beaucoup de temps à mettre en place (outre la difficulté, il faut un minimum réfléchir au sens de ce qu'on fait, puis au contenu même de nos "tags", relations et autre. Par exemple, construire une liste de liens xfn-ée est bien moins facile qu'il ne semble de prime abord. Ou bien c'est moi qui me pose trop de questions, c'est une autre histoire.

Et puis le fait que ce ne soit pas visible pour l'utilisateur et non-utilisé par les moteurs de recherche n'encourage pas à se lancer dans une telle démarche. Le moment où les choses évolueront de ce côté là, il sera bien assez tôt pour refondre un site complètement sémantiquement.

Dans un cadre professionnel, n'en parlons même pas, si "temps passé" n'est pas égal à "profits immédiats", alors l'équation est fausse pour nos très chers chefs et marketeux.

En bref, la sémantique, les méta-données, les microformats toussa toussa, oui pourquoi pas, mais plus tard peut-être. Patientons, laissons se décanter la situation, laissons les techonologies murir, puis reparlons-en.

ArnO le 16/08/2006 :

Pour assouvir les connaissances Biolo du geek et autres, un petit point sur l'utilisation du Web sémantique dans la recherche fondamentale en Biologie:
- le "tagging": il existe Connotea (de la revue Nature), qui est le Del.icio.us des scientifiques, pour les articles (te connaissant impliqué dans l'Open Articles www.biologeek.com/journal... c'est retourner les outils des éditeurs contre leurs intérêts!)
- les Ontologies, description des connaissances biologiques: là il en pleut de partout. Tous les domaines sont touchés, c'est l'invasion... On classe les molécules, on définit des processus biologiques, de l'imagerie, de la taxonomie, de l'anatomie et beaucoup d'autres mots qui finissent en "ie". Le meilleur référencement est certainement celui des projets Open Biomedical Ontologies obo.sourceforge.net/
- le lien d'éléments de ces ontologies à travers d'autres documents et d'autres contextes. Dans mon étude actuel, je défini des cascades de réactions de molécules, qui sont annotées en RDF par des référence aux bases de données telles que Gene Ontology, ChEBI, Uniprot. Donc on utilise les éléments des ontologies pour créer de l'information. Il devient alors plus aisé de faire des recherches sur ces documents "conformes".
Très certainement à compléter.
ArnO

Got le 16/08/2006 :

Il ne faut pas exagérer le côté "sémantique" des technologies du Web sémantique. Evidemment, le but final est d'ajouter du sens aux milliers d'information qui transitent sur le Web, mais RDF, qui est la base de toutes ces technologies, offrent surtout un moyen de décrire et d'organiser l'information, là où XML sert à la structurer (d'où ma série de trois billets sur la question que tu as déjà citée).

Il faut aussi avoir en tête que les activités Web sémantique au sein du W3C sont avant tout de l'ordre de la recherche en informatique et en sciences de l'information. Evidemment, les sociétés ont un oeil dessus, mais il faudra encore quelques années pour que ces technologies soient rentables. Quant au grand public, ce n'est clairement pas le public visé pour l'instant, même si les applications seraient pour nous tous très intéressantes, en particulier pour améliorer la recherche d'informations. En fait, les plus concernés sont les chercheurs dans différentes disciplines que ce soit en sciences dures ou en sciences humaines. Je suis un peu étonné que tu n'aies pas cité les travaux effectués autour des ontologies en biologie (cf le logiciel Protégé développé par le labo d'informatique médical de Stanford : smi.stanford.edu/ ) auxquels faisait allusion précédemment Arno. Mais, les sciences humaines (je suis en quelque sorte un historogeek ;-) ) et les professionnels de la documentation comme les bibliothèques et les centres d'archives s'intéressent aussi à ces questions.

Maintenant, il y a largement de quoi s'amuser et ajouter effectivement un peu d'informations "sémantiques" dans un site Web en utilisant les technologies du Web sémantique. Dans ce cas, ces fichiers peuvent prendre la place d'informations habituellement stockés dans des tables et des champs d'une base de données relationnelles en offrant une plus grande souplesse et évolutivité. Il faut d'ailleurs ajouter que XML n'est qu'une des syntaxes possibles pour écrire du RDF, il en existe d'autres : turtle, N3 ou N-triples qui peuvent s'avérer plus simple pour certains. Et, entre nous, ajouter des microformats dans du HTML se révèle aussi compliqué que d'écrire un fichier FOAF en syntaxe XML à la main et je ne parle même pas d'écrire du code ;-)

Tu as cité quelques vocabulaires RDF (et non format :-) ), j'en ajouterais au moins quatre autres que sont OWL, le vocabulaire RDF pour définir les ontologies, tout simplement RSS 1.0, la seule version RDF de RSS qui sera certainement détroné par la version OWL de ATOM (atomowl.org/ ) et surtout Dublin Core, le pionnier des vocabulaires RDF permettant à l'origine la description des pages Web (pour une introduction sur ce vocabulaire : openweb.eu.org/articles/d... ). Par ailleurs, comme l'a rappelé Simon dans le billet que tu cites, je ferai une place très importante à SPARQL, l'équivalent de SQL pour les fichiers RDF. J'ai écrit pas mal de billets qui font références à tout cela et qui sont rassemblés à l'adresse : lespetitescases.net/index... et pour ceux qui voudraient voir un site entièrement basé sur un fichier RDF, j'ai construit un mini-site à partir d'une ontologie en OWL du monde d'Harry Potter (lespetitescases.net/de-la... ) (Attention, il n'y a aucun graphisme, c'est du web 0.1 à ce niveau-là ;-) ).

Le Web sémantique est un sujet passionant dont les possibilités sont immenses et qui se trouvent à la croisée de nombreuses disciplines d'où sa difficulté qui selon moi ne se situe pas au niveau technique pur, mais dans les aspects conceptuels. Enfin (et j'arrête mon long billet, désolé :-) ), les technologies sont à présent suffisamment matures pour commencer à sérieusement s'amuser (à ce propos, je vous conseille de jeter un coup d'oeil à SIMILE, simile.mit.edu/ ), so have fun ;-)

Omnisilver le 16/08/2006 :

Coquille : le prouve -> le prouvent

Pour le billet ... j'avoue que je n'ai pas tout lu même si ça avait l'air intéressant (c'est pas mon niveau) ^^

David, biologeek le 16/08/2006 :

@giz404 :
> Patientons, laissons se décanter la situation, laissons les techonologies murir, puis reparlons-en.

Ça peut être sympa d'être dans les précurseurs aussi. C'est un investissement mais c'est intéressant. Je commence à en avoir marre d'utiliser le web passivement, j'ai envie d'y contribuer ! Pas en lançant une startup2.0 mais en pensant sur le long terme, pas forcément en terme de profits (financiers). Après pour les entreprises, c'est sûr qu'elles ne peuvent pas prendre ce risque... à moins d'avoir quelques geeks dans leurs effectifs ;-).

@ArnO : Merci pour tous ces liens, en plus j'ai des besoins de biolo en ce moment, je vais regarder tout ça de plus près. En tout cas ça à l'air sympa ton sujet !

@Got : Wow ! Ça c'est du commentaire. Merci pour tout et ne sois pas désolé d'ajouter autant de qualité à ce billet.

> En fait, les plus concernés sont les chercheurs dans différentes disciplines que ce soit en sciences dures ou en sciences humaines.

Décidemment il aura fallu que je sorte de la recherche pour en découvrir certains aspects passionnants...

> Le Web sémantique est un sujet passionant dont les possibilités sont immenses et qui se trouvent à la croisée de nombreuses disciplines d'où sa difficulté qui selon moi ne se situe pas au niveau technique pur, mais dans les aspects conceptuels.

C'est justement ce qui me plait, je n'aurais pas pu mieux l'exprimer :-).

@Omnisilver : merci c'est corrigé... c'est plus une question de curiosité que de niveau à ce stade là, je ferais des efforts pour être encore plus accessible la prochaine fois.

ArnO le 16/08/2006 :

Web sémantique et Web 2.0
Je m'obstine à ne pas comprendre pourquoi tu souhaites changer ton blog. C'est une mine d'information incroyable tel qu'il est organisé, clair et bien maintenu (je sais pas combien de petits chinois travaillent à ton compte pour fournir autant de post!).
Qui plus est, pour débattre sur l'interêt du sémantique, je ne pense pas que tu devrais lâcher ton système. Tu fais partie d'un monde communautaire et de l'échange d'information, tout se qui constitue le Web 2.0. Ce sont tes posts et les réactions quelle engendre dans ton audience qui font la force de tes documents. Le Sémantique t'apportera un couche de description des fiches, facilitera peut-être la recherche de ton lecteur (s'il métrise bien un outil de recherche perfectionné, qui n'existe pas), mais certainement pas ta vie... Je vois déjà la difficultés de décrire parfaitement un document, qui plus est dès que tu veux bouger ton organisation, voilà la galère. Non, je pense qu'il n'y a aucun outil pour maintenir les blogs grâce au Web sémentique qui vaille DockClear, qui est un outil maintenu largement diffusé, plutôt famillier et très développé. Autre point de vue, si on ne tient pas compte des standards, je trouve ton blog très sémantique. Sans déconner, l'information sur un thème est aisément accèssible. Si je veux promouvoir Windaube et que je tombe sur ton site, je sais rapidement que se sera pas ici que je serai crédible (le sous-titre suffit!). Bref, laisse le sémantique au dévellopement et à la recherche et sûr que l'outil de blog idéal apparaitra un jour.
Et le coup de gueule de la fin: le super pas sémantique de biologeek (là il faut regarder le titre), c'est que t'as perdu une particule. Je trouve que tu t'es méga orienté sur l'actu info libre, programmation... Au registre Bioinformatique, on trouve une critique de ta formation (très bien pour les jeunes étudiants, NB: je pense vraiment que ca doit être la meilleure formation bioinfo en France), une réflexion philosophique dont j'ai franchement rien compris digne de fumeurs de marijuana qui atteignent le Nirvana, des introductions au domaine. Qu'est ce qui en est de tes recherches bioinfo actuelles. C'est là que tu pourrais avoir une avance. Le seul blog bioinfo francophone que j'ai trouvé est un clampin qui fais de la bioinfo en Inde et qui t'a pomper ton nom de domaine. Bref, de la Bio please. L'informatique, tout le monde en traite, je satuuuuuuuuuure. fin du coup de gueule
Merci infiniment pour le travail que tu fourni à la communauté et bon courage si tu te lance dans le sémantique.
ArnO

David, biologeek le 16/08/2006 :

Ouch, bon je vais méditer sur tout ça, la nuit porte conseil comme on dit...

Juste une petite précision quand même : je ne fais actuellement plus de bio-informatique (je suis embauché en tant que consultant technique pour faire du développement web).

Charly le 30/08/2006 :

David, achete vite infogeek.com ;-)

Un nom de boîte ? Tu as cherché en bioinfo ou pas du tout ? Qu'est ce qui motive ton choix ? Je pose la question car effectivement notre formation est très orienté BIOinfo et beaucoup moins (voir pas du tout) bioINFO. La nuance est importante car la plupart des formations de bioinfo en france sont destinées à des informaticiens... pas besoin de 5 années de biologie pour comprendre les termes utilisés dans une base de données :-/ Donc le travail que tu commences correspond à une démarche personnelle ? une opportunité sans aucun doute... Des détails sur ta recherche d'emploi ?

Comme Arno, je trouve ton site très bien. Pourquoi vouloir le changer, je regrette aussi ta nouvelle orientation, trop web 2.0, bref trop mode et sans vouloir ignorer ces évolutions, ce n'est pas ça qui me fera venir sur ton blog ;-)

Bonne continuation & donne nous des news de ton boulot mais pas trop en mal si tu veux pas te faire virer à cause de ton blog (Cf. blog Maitre Eolas & Co. )

Cu.

biou le 31/08/2006 :

Biologeek, connais-tu GRDDL? cela permet d'obtenir du RDF à partir de microformats, entre autres. Donc il n'y a qu'à modifier la page pour qu'elle supporte un ou plusieurs microformats, et ajouter un entete grddl. Ensuite avec un lecteur qui supporte GRDDL, tu charges la page et tu récupères une version RDF. Il n'y a donc pas besoin de produire le travail en double comme tu le dis dans ton article.
Plus d'infos chez le boss, Danny Ayers : dannyayers.com/2005/08/01...

Alex le 07/09/2006 :

Une alternative aux microformats est également l'inclusion de RDF dans ses pages HTML via eRDF ou RDFa. Un petit comparatif des 3 ici: www.bnode.org/archives2/5...

Sinon je dirai également qu'il ne faut pas hésiterà créer son profil FOAF ou a utiliser DOAP pour décrire ses projets, surtout qu'il existe des outils pour générer le code correspondant.

Et concernant SIOC, le plugin DC devrait-etre mis à jour rapidement (d'ici le week-end), je t'invite à l'utiliser et à te lister sur la page des sites exportant leur contenu avec SIOC, ca te permettra d'être crawlé et intégré aux autres sites via ce browser par exemple - quand il veut bien ne pas être en rade - apassant.net/home/2006/06...

David, biologeek le 07/09/2006 :

@Charly : j'ai mis à jour mon CV. Pour les autres questions on sera peut-être mieux en privé effectivement :-).

@biou : je ne connaissais pas, merci pour le lien. Je vais voir ça de plus près.

@Alex : oui, je vais commencer par améliorer l'existant progressivement. Merci d'avoir pointé sur ton plugin, ton blog est très intéressant.

Alexandre Passant le 12/09/2006 :

SIOC Exporter pour Dotclear, v1.4

Les évolutions précédentes sont passées un peu inaperçues - aucun billet à ce sujet - mais une nouvelle version du plugin SIOC pour DotClear est aujourd'hui disponible. Ce plugin permet donc d'exporter le contenu de votre blog (billets,...

Alex le 12/09/2006 :

Merci David :)

Sinon, puisque tu parles d'ubuntu-fr dans ton exemple sur SIOC, est-ce que par hasard tu aurais l'idée de coder un plugin PunBB pour exporter les forums ubuntu-fr avec SIOC ? Ca pourrait etre sympa de voir ce que ca donne sur une telle communauté (réseaux, activité, voir lien avec les blogs des utilisateurs si eux aussi utilisent le plugin).

N'hesite pas a venir sur #sioc ou sur la ML si ca t'interesse

ousintkd le 20/09/2006 :

Salut!

Je suis etudiant et j'ai comme projet : Réalisation d'un moteur de recherche intelligent avec les technologies du web semantique. Je me suis plongé à fond sur le sujet mais je n'ai pas l'impression d'avancer. Je voudrais de l'aide et si possible de partenaire qui seraient prét à aprendre avec moi.

Ma boite: ousintkd@yahoo.fr
id yahoo messenger: ousintkd
id Msn messenger: ousintkd@hotmail.com
id skype: ousintkd

Merci. Je vous attend

karl le 25/09/2006 :

ousintkd

Avant tout il te faut tenter de résoudre un problème particulier. Cela te permettra surement d'avancer plus surement. Par exemple comment créer un back-end en SKOS qui utiliserait en UI le principe de tags améliorés.
À partir de cela tu pourrais explorer les stratégies pour rendre la vie facile à l'utilisateur.