★ Biobuntu : un live CD pour la bio-informatique

Suite à la discussion occasionnée par le test de KnoSciences par Play, je me suis mis à réflechir à l'intérêt d'un tel CD. Il se trouve qu'actuellement, les seules distributions en LiveCD qui sont axées sur une utilisation scientifique le sont plutôt dans le domaine des mathématiques ou de la physique

Voici celles que je connais, liste non exhaustive bien entendu :

Aucune de ces distributions ne répond à l'attente que j'ai d'un LiveCD scientifique, soit il manque un langage de programmation essentiel, soit il manque un programme qui ne sert qu'aux bio-informaticiens (type rasmol,...). J'ai donc décidé de créer un LiveCD qui soit spécifique à la bio-informatique.

Pour cela, je vais bien entendu utiliser Ubuntu, d'autant qu'une telle réalisation est bien documentée sur le site officiel. Il reste maintenant à définir le contenu de ce LiveCD et c'est là où je vais avoir besoin d'aide, voila les logiciels que je trouve déjà indispensables :

  • Programmation
    • C/C++
    • Perl ( + BioPerl)
    • Python ( + BioPython)
    • Java ( + BioJava)
    • R
    • Matlab Scilab, son cousin est payant...
  • Bureautique
    • Openoffice
    • LaTeX
    • Xpdf
  • Internet
    • Firefox (+ extensions appliquées à la bio-informatique)
    • Thunderbird
  • Multimédia
    • K3B
    • GIMP
    • gThumb
  • Par domaines
    • Modélisation moléculaire
      • rasmol
      • PyMOL
      • gnuplot
      • Cn3D
      • GROMACS
      • Garlic
      • Raster3D
      • TINKER
    • Neurosciences computationnelles
      • NEURON
      • PDP++
      • NSL
    • Bio-informatique génomique
      • Artemis
      • ClustalX
      • EMBOS tools
    • Phylo-génétique
      • NJPlot
      • SMILE
    • Analyse d'Images Numériques
      • ImageJ
  • Autres
    • Open Babel

N'hésitez pas à laisser un commentaire si vous trouvez qu'il manque un logiciel qui vous sert dans la liste (celle-ci sera remise à jour en fonction des commentaires). Ceux sus-cités sont le fruit de ma petite expérience...

Concrètement, le but de ce LiveCD sera de pouvoir travailler sur n'importe quelle machine, elle pourra donc être utile aux étudiants ou aux chercheurs qui n'ont pas accès à leur ordinateur pendant une longue période (vacances,...) mais qui souhaitent tout de même travailler (oui je sais c'est mal ;-) ). Biobuntu pourra aussi permettre aux professeurs d'initier leurs étudiants à Linux et de leur faire découvrir le monde du logiciel libre par l'exemple, voire de leur distribuer le LiveCD au début de l'année pour qu'ils disposent de tous les outils dont ils auront besoin.

Voila pour l'instant les bases du projet sont posées, n'hésitez pas à me contacter si vous voulez participer !

[edit] : il faut aussi que je rajoute les logiciels contenus dans DNALinux mais que je recherche d'abord à quoi ça correspond donc je le ferai au moment où je ferai les liens de toute la liste :-).

— 25/01/2005

Articles peut-être en rapport

Commentaires

olivier le 26/01/2005 :

Les modules biopython, bioperl et même biojava, pour automatiser certains processus d'analyse, non ?

David, biologeek le 26/01/2005 :

En effet, c'était sous-entendu mais je les ai rajoutés, merci de ta contribution :-)

Play le 26/01/2005 :

Salut Titus !

Excellente idée !!! Je connais trop peu la bioinformatique pour te proposer des applications. Mais bravo pour l'idée. Je suis impatient de voir le résultat.

A+

David, biologeek le 27/01/2005 :

Merci pour tes encouragements Play ! (je compte sur toi si j'ai des questions techniques ;-) )

Play le 28/01/2005 :

N'hésite pas ! :)

Julot le 28/01/2005 :

je pinaille mais dans ta liste, Pymol apparait 2 fois
et si la place est un élément limitant il n'est peut etre pas indispensable de mettre rasmol ET pymol

David, biologeek le 28/01/2005 :

Ok pour Pymol c'est corrigé.

En ce qui concerne ces deux logiciels, lequel préfères-tu ? ;-)

J'ai une préférence pour rasmol car il y un paquet tout prêt dans ubuntu mais je ne vais pas faire mes choix en fonction des paquets !

Kévin le 30/01/2005 :

Logiciels intéressants , voici les références sous Windows :
- Minitab : modélisation statistique appliquée à la bio
- Prosite / Swissprot : banques de données pour la biochimie, génétique, et biologie moléculaire (sites Internet)
- Oxheart : logiciel d'expérimentation in vivu , physiologie animale (disponible uniquement à l'université d'Oxford en théorie)
- Multifit : cinétique enzymatique
- Cricket graph : cinétique enzymatique également
- Microcal Origin : grapheur scientifique (pharmacie / réceptologie)

Julot le 31/01/2005 :

Perso je préfère rasmol car il est ultra simple d'utilisation et que je n'ai jamais eu le courage de me pencher sur Pymol ;-)
Il parait que Pymol est mieux ....

David, biologeek le 01/02/2005 :

@Kévin : en effet, ces logiciels ont l'air intéressants mais ils ne sont pas libres et ne sont pas portables sous Linux... je vais essayer de trouver des équivalents :-)

@Julot : ok, il a aussi VMD, je verrais selon la place qu'il reste en fait parce qu'ils ne prennent pas trop d'espace finallement !

Kévin le 01/02/2005 :

Oui, ils sont intéressants, et surtout essentiels en pharmaco / physiologie / etc.
Tu peux me tenir au courant si tu trouves les équivalents de ces logiciels en libre ?

Julot le 02/02/2005 :

A mon avis
pour des equivalents de Minitab, Multifit, Cricket grah et Microcal Origin, ya le bon vient R des chaumières ;-)
Deja de base il est bien pour les plot et les analyses stats, mais si tu veux un truc plus spécifique à un domaine ce serait bien le diable s'il n'y avait pas un pti package disponible ...

gist le 11/03/2005 :

Bonjour,
Je suis celui qui oeuvre derrière la Knoscience et je trouve ton post très intéressant. Particulièrement la liste des logiciels libres utilisables en Biologie. J'y rajouterais le logiciel JAVA Populus : www.cbs.umn.edu/populus/

Le choix des logiciels de la knosciences dépend principalement des logiciels que je connais en Physique/Chimie et de ceux que connais ma collègue en Math. Il nous manque un Biologiste dans notre groupe. (Contacte moi :-)
La place sur le CD est aussi un facteur non-négligeable.

Je pense migrer prochainement la knosciences vers un CD live Ubuntu parceque la reconnaissance du matériel est aussi bonne que celle de la knoppix et qu'il serait possible de faire un CD live knosciences PPC

Cependant, l'environnement gnome ne devrais pas être le bureau par défaut d'une distribution généraliste scientifique (Beaucoup trop lourd pour la majorité des postes en collègue et Lycée). Xfce4 ou Rox Desktop sont plus apropriés

David, biologeek le 11/03/2005 :

Je suis très intéressé, je te contacte :-)

Claude le 06/04/2005 :

Bonjour,
je ne connais vraiment rien à la biotruc...;o)
Mais d'avance, mettre en avant les logiciels libres sur des sujets pointus, je trouve celà vraiment génial. Et l'idée de séduire des profs qui pourraient distribuer des CD aux élèves en début d'année l'est encore plus!
bravo, et merci pour le libre!
Les libéraux ne te le rendront pas,
Mais la liberté n'a plus le temps d'attendre!

Anticonstitutionnellement vôtre

David, biologeek le 06/04/2005 :

Je suis très heureux de susciter une telle réaction !
Merci, c'est ce type de commentaires qui me fait avancer :)

Humainement,

Marc le 28/06/2005 :

Il reste un gros problème : faire touner SCILAB sous Ubuntu.
Deux merveilleux produits.
Officiellement, il y a un package SCILAB dans les dépôts Ubuntu.
Mais si quelqu'un de motivé et compétent et ayant un peu de temps pouvait faire que ça marche (problème de dependencies?) il serait encensé (enfin... n'exagérons pas) par la communauté scientifique.

Jay le 01/09/2005 :

Sorry, I cannot write French (but I understand it). It would be great if you could include Arb (arb-home.de/) and Staden (dna.biotech.wisc.edu/Stad...) and if this would be installable on the hard drive.

bionux le 25/09/2005 :

quand allez-vous sortir cette distrib, cela pourrait être bien de tester...

merci

Endorphine le 07/10/2005 :

+1 ! ;)

Fab le 10/01/2006 :

Bonjour,

Je suis tombé par hasard sur cette discussion que je trouve très intéressante. Dans la liste, j'ajouterai R (pour les stats ca me parait bien vu tout les packages qui existent, ca peut valoir le coup de l'inclure)

C'est long pour développer un tel projet ?

David, biologeek le 10/01/2006 :

Bonjour Fab,

Par hasard ou en cherchant un poste ? ;) Bon trève de plaisanterie, R était déjà listé dans « Programmation » tout là haut car c'est vrai que c'est bien pratique en bio-informatique (même si j'ai découvert que l'interfaçage de Python avec matplotlib était beaucoup plus puissant au niveau du graphisme et de la malléabilité des graphes générés).

Concernant la durée de développement, tout dépend des compétences initiales, dans tous les cas il est conseillé de contacter gist (plus haut dans les commentaires) qui a de plus amples compétences pour répondre à cette question que moi.

Devant l'engouement que suscite le post je suis en train de reconsidérer ma position actuelle mais bon ça va attendre au moins février tout ça.

maceo le 12/01/2006 :

treeview, seaview, phylip et ... acrobat reader. Xpdf n'est malheureusement pas toujours capable de tout lire.

Joël le 12/01/2006 :

Bonsoir,
Ce projet est excellent, il me tarde de le tester. Les applications suivantes me semblent importantes:
Treeview, seaview, readseq, perlpcr.... et pouquoi pas Bzflag? ;-)
Sincèrement

ludo le 17/01/2006 :

Bonjour,
Excellentissime idée de faire un CD Live pour les bioinformaticiens!Mais une question: Pourquoi Ubuntu?
Ce serais bien de rajouter des outils d'alignements de séquences (T-COFFEE, DIALIGN-T, BLAST, FASTA, et ceux que je ne connais pas), des logiciels de prédiction de motifs par HMM.
Quel site pourra-t-on utiliser pour avoir le LiveCD ?
Bonne chance !!

Hoxus le 27/01/2006 :

Il serait utile de fournir avec bioperl les API d'Ensembl (www.ensembl.org/index.htm... ,site bien connu des bioinformaticiens) qui propose d'interroger via un script Perl leur DB en direct.

chicken78 le 09/02/2006 :

C'est une bonne idée : mais existe-t-il des logiciels EXAO sous linux?

David, biologeek le 09/02/2006 :

Bonne question, aucune idée :)

Lepto le 22/02/2006 :

Bonjour,

A rajouter dans les distribution existantes et Bio: Biolinux envgen.nox.ac.uk/biolinux...

Ils viennent de sortir un DVD Live et c'est basé sur Debian... Je n'ai pas encore eu beaucoup de temps pour tester... En tout cas, heureux de trouver un site qui peut regrouper des informations sur le libre et la bio :)

bapoumba le 22/02/2006 :

salut :)
je viens de voir aussi.
le prob de la bio et des LL c'est que c'est surtout orienté analyse génomique, comparaison de séquences et structures des protéines. C'est un domaine en plein boum, c'est sûr, mais tout le monde ne s'y retrouve pas (et en particulier une physiologiste old-fashion comme moi :p).
Dans ce cas on ne peut que se tourner vers des applis très commerciales et très chères, même pour l'enseignement...
j'ai essayé de convaincre des collègues us de porter leur soft, qu'il distribuent gratuitement, vers linux www.luhs.org/depts/physio...
ainsi qu'un autre qu'ils n'ont pas encore mis en ligne, mais c'est pas gagné !

blo06 le 04/03/2006 :

Bon, ça a l'air d'intéresser du monde : où est ce qu'on downloade, afin qu'on puisse tester ?

hoioh le 27/03/2006 :

Pas de réponse pour blo06 ??? Ca m'intéresse aussi de savoir où le télécharger ce livecd qui m'as l'air bien sympatoch' ...

David, biologeek le 27/03/2006 :

Pour l'instant ce projet est en stand-by, ça pourrait changer dans 6 mois mais je pense que la knoscience : gistlabs.homelinux.net/wi... reste la meilleure alternative pour la bio-informatique actuellement.

Je n'ai pas forcément le temps de tout tester, n'hésitez pas à apporter votre témoignage ici ;-).

angelius le 03/04/2006 :

Je trouve cette idée vraiment sensationnelle, surtout le côté relationnelle prof/étudiant. Etant donné que dans ma classe je suis le seul à m'interessé à "l'univers " du logiciel libre et à Ubuntu, j'aimerais bien essayer de faire partager ma faible connaissance à ma classe et à mes professeurs.
En regardant les différents paquets dans Synaptic, j'ai découvert qu'il y en avait plusieurs pour la radioamateur et l'électronique, étant donné que je suis étudiant en elec, je serais interessé de faire le même genre de projet que toi mais porté sur l'electronique et la radioamateur.
Peux-tu m'indiquer la "procédure" à suivre pour réaliser un live-cd stp ?
je te remercie d'avance

David, biologeek le 03/04/2006 :

Comme mentionné dans le billet, la documentation pour faire un tel LiveCD se trouve sur le site officiel : wiki.ubuntu.com/LiveCDCus...

Bon courage :)

angelius le 10/04/2006 :

je te remerci bcp pour la réponse. et te souhaite bonne chance dans la réalisation de ton projet.

Katie le 17/05/2006 :

Hi.

Do the Ubuntu CDs (Breezy, etc) have bioperl pre-installed? If so, I couldn't find it. I'm using 5.10.

Thanks.

David, biologeek le 18/05/2006 :

Katie :

This CD is just a project and unfortunatly have never been done. All those comments really encourage me to take time to do it.

Cheers.

arno le 20/05/2006 :

Tu veux faire un live-DVD bioinfo. Brillante idée.
Voilà déjà l'existant, ToBiX: tunicata.techfak.uni-biel...
Ce live CD est très bon. Blast et surtout beaucoup de logiciels pour la biologie des systèmes. Tu modélises des systemes autour du langage SBML (XML like). Beaucoup de liens sur la bioinformatique integrés dans le renard de feu. Je le recommande à tous les bioinformaticiens et étudiants bio.
Il est surtout axé sur l'anotation, qui est l'escence de la bioinfo, c'est comme ça qu'on créer de l'information. Tous les logiciels bioinformatiques sont fait pour ça.
Good luck

dav le 28/05/2006 :

sans rapport direct>faudrait un livecd ubuntu orienté graphisme...grafpup m a convaincu qu'a moitié.

pépère le 11/06/2006 :

euh... ma contribution va être très simple.

Mais je n'ai pas vu "emacs" et "ess" et autre joyeuseté (bon aller, vi aussi) dans la section bureautique... Je n'utiliserai jamais un live cd scientifique sans eux !

David, biologeek le 11/06/2006 :

Ces logiciels sont inclus par défaut sous Ubuntu ;-)

David le 18/07/2006 :

Je trouve cette idée excelente...
Dans la liste des appli citées ci-dessous je n'ai pas vu d'applications de modélisation cellulaire comme e-cell, v-cell etc...

voici le site de e-cell:
www.e-cell.org/

Garfield le 08/08/2006 :

Bonne idée. il manque cependant un logiciel de bibliographie. Perso je trouve Bibus très bien car il s'intègre avec open office

pab le 24/08/2006 :

Salut
bravo pour l'idée et merci pour tous.
Je fais plustot de la biologie moléculaire et je siuis en train de chercher juste un logiciel libre et facile d'utilisation pour faire quelques manips tres simples (alignements, traduction, mutagénèse et production de figures) et je n'en trouve pas. Je ne sais pas si tu pensais en ajouter dans ton CD, mais je pense que des logiciels tels que DNA Strider (mac ) sont toujours utiles et pas vraiement lourds (je crois). Des logiciels d'analyse de séquence peuvent aussi être vraiement très intéressants.
Là je suis en train de voir ce qui existe sous windows (Geneious, CLC, DNASIS max, MB advanced DNA analysis, DNA for windows, bioedit et bioline), je pourrais te donner un avis si tu penses qu'un de ces logiciels peut être intéressant à ajouter....?
En tous cas merci de t'attacher à cette tâche, si je peux t'aider, mais je suis une quiche en informatique... desolé
Pab

nico le 28/08/2006 :

Excellente innitiative !
Dans la liste des outils, je n'ai rien trouvé a propos de php et mySQL (apache ...)
Je rajouterais le bon vieux editeur emacs pour la programmation.
Niveau Bio-info génomique, en plus des outils EMBOSS, pourquoi MEME qui est surement l'outil le plus efficace pour la recherche de motifs.
Et pourquoi pas Kile, qui est un éditeur LaTex qui simplifie bp les choses pour les personnes les moins habituées !



dkieffer le 05/09/2006 :

Super ton idée!
Comme IDE, il pourait y avoir Eclipse avec les plugIn correspondant... C/C++, TeXlipse..... C'est plus sympa que gedit ou Emacs...

Pour la biomol, on utilise beaucoup "ApE A Plasmid Editor" dévellopé en TCL (et ouai c'est dans les vieux pots.....) pour faire des cartes de restriction.

Sinon il y a JalView, un logiciel en java pour éditer les alignements multiples, qui est pas mal...

deltamoins le 21/12/2006 :

Bonjour,

Je vois que le monde de la bio et de linux bouge pas mal, je me joins à la joie général pour ce genre de projet bien sûr !
Cependant je constate encore une fois que tout cela fournit uniquement les gens qui bossent sur les séquences. J'utilise pour ma part des marqueurs microsatellites (désolé si je suis has been...) et je ne trouve rien pour ce genre de marqueurs. Je suis donc obligé d'utiliser GeneMapper d'Applied Biosystems (sous Windows bien sûr !) et dans le genre logiciel propriétaire ils sont vraiment une caricature. J'essaye de chercher une alternative libre mais je ne trouve rien de rien...
Est-ce que quelqu'un pourrait m'aider ?

Merci d'avance et encore chapeau à tous ceux qui développent pleins de trucs !

librecono le 21/12/2006 :

J'arrive probablement après la bataille, mais je viens de voir que la Quantian ( dirk.eddelbuettel.com/qua... ) n'est pas reprise dans la liste ci-dessus. Je pense qu'elle pourrait intéresser les biologistes et tout particulièrement les bio-statisticiens.

deltamoins le 22/12/2006 :

J'ai peut-être trouvé un logiciel qui permet d'analyser les microsatellites. Il s'appelle Genographer (hordeum.oscs.montana.edu/... Je ne sais pas encore s'il fonctionne correctement avec des données qui sortent de n'importe quel appareil...
Je vous tiens au courant.

deltamoins le 09/01/2007 :

Bonjour,

Je vous donne l'état de mes recherches, ça peut intéresser d'autres personnes. Vu que le sujet est commencé, autant le "terminer" avec des infos.
Deux logiciels libres existent qui offrent une alternative à GeneMapper :
- STRand développé par l'université de Davis en Californie (www.vgl.ucdavis.edu/infor... mais il ne fonctionne que sous Windows et il ne traite pas les fichiers de données issus de tous les appareils de génotypage (notamment pas les plus récents).
- Genographer développé par l'université du Montana (hordeum.oscs.montana.edu/... mais qui ne traite pas les fichiers de données de tous les appareils de génotypage dont les plus récents.
Voilà l'état de ma recherche pour le moment. Je vais donc surement opter pour la solution émulation et installé WINE pour pouvoir installer le logiciel GeneMapper si ça marche...

Merci encore pour votre aide.

Thomas le 20/03/2007 :

Salut,
j'arrive un peu tard, mais bon tant pis je me lance! Ne serait il pas intéressant d'y ajouter Apache et Tomcat (et Ant aussi) pour permettre un déploiement d'applications du genre d'UCSC?

Stéphane le 06/08/2007 :

Salut,
pour la phylogénétique pourquoi ne pas ajouter phylowin pour la reconstruction d'arbre et seaview pour l'alignement de séquences (du PBIL (pbil.univ-lyon1.fr/)). Il serait aussi interessant de reprendre Mr Bayes (mrbayes.csit.fsu.edu/) car il ne me semble pas avoir vu ce type de programme dans la compilation prévue...

Emy le 26/08/2007 :

Ce live CD est vraiment une bonne idée, j'espère que le projet tient toujours :) Bon courage en tout cas, et bonne continuation !

utodeb le 14/11/2007 :

Bonjour,
J'arrive comme les derniers commentaires le stipulent après la bataille...
Je sais pas si t'y a pensé mais il serait peut être sympa (user friendly comme les geek disent je crois) d'intègrer à R par default une interface graphique comme Rcommander qui est contenue dans les packages de R. Je ne pense pas que cela te serait difficile et le suis sur que cela facilite l'utilisation de ce logiciel qui est pas vraiment "user friendly" ;-)

sinon très bonne initiative

Tony Travis le 29/02/2008 :

S’il vous plaît jeter un coup d'oeil à mon 'biobuntu ébauche à:

blueprints.launchpad.net/...

S’il vous plaît soutenir cette initiative si vous êtes intéressé à mettre en place un projet sur Ubuntu bioinformatique "Launchpad"

Merci, Tony.

David, biologeek le 29/02/2008 :

@Tony : Excellent ! Merci d'avoir pris le temps de mener à terme ce projet. Je manque de motivation (et de temps) pour contribuer mais je suis heureux de voir que ça a aboutit.

Bon courage pour la suite !

Joseph le 05/07/2008 :

Ca fait un bout de temps que, du fait de mes études en bioinformatique, je suis confronté à l'utilisation de Linux.

Je me souviens encore quand j'ai découvert les BioKnoppix et Vygiaan CD, c'était l'euphorie. Ceci dit, je ne les ai jamais installé voire même jamais utilisée à des fins de recherche.

Maintenant que je travaille dans la bioinfo (Modélisation Moléculaire), je commence à douter de l'intérêt de ces distributions spécialisées pour les professionnels : la diversité des logiciels n'est pas représentative du travail qu'un chercheur peut faire. (On va rarement du séquençage à la dynamique moléculaire en passant par la programmation).

Ceci dit, il est vrai que cela permet aux étudiants d'avoir un environnement de travail avec "tous" les logiciels nécessaires.

Sinon en visualisation il y a aussi :
- Molegro ( http://www.molegro.com/mmv-product.php )
- Molekel ( http://bioinformatics.org/molekel/wiki/ )
- Gabedit ( http://gabedit.sourceforge.net/ )

voila c'était "just my 2cts"

Arnaud le 28/05/2009 :

Etant en m1 de bioinformatique , je dirai qu'il manque un environnement pour développer en php,par exemple Lamp, ensuite je verrai Eclipse pour le Java, et pour la phylogénie je verrai bien Phylip, phyml.
Et pour les loisirs perso Blender :D.
ps : j'adore ton blog

salut le 13/03/2011 :

Bonjour, je voudrais savoir ce qu'il en ai du projet de liveCD bioinfo

A bientot