Déjà, pour se mettre dans le contexte, qu'est-ce que la bioinformatique ? C'est une discipline qui a été créée suite à un besoin grandissant de l'outil informatique dans la biologie. En particulier un besoin de stockage, d'organisation et d'accès à l'information - constituée entre autres de séquences de protéines et de gènes - dont la croissance va encore plus vite que la loi de Moore [1]. Il faut aussi mettre en place des algorithmes adaptés aux nouveaux problèmes rencontrés : par exemple, comment trouver efficacement une séquence dans une banque de données de plus en plus gigantesque et traiter rapidement un nombre de recherches en augmentation constante ? [2] Cette question a fait l'objet de nombreuses thèses et projets de recherche durant ces vingt dernières années, preuve de la fraîcheur de cette discipline. Ou encore, comment trouver la fonction des protéines dont on suppose l'existence et dont on possède une séquence ? Certains projets médiatiques comme Folding@Home [3] tentent d'apporter des éléments de réponse, en demandant à tous les internautes du monde entier de contribuer avec leurs propres machines, seule façon viable de pouvoir calculer relativement rapidement la structure tridimensionnelle des protéines et ainsi de pouvoir se donner une idée de leur rôle.

La bioinformatique est donc une sorte de catalyseur pour la recherche. Grâce à elle, la science peut notamment trouver plus rapidement des médicaments ou solutions contre certaines maladies (allant d'Alzheimer au cancer). Mais elle joue aussi d'autres rôles, par exemple pour affiner les recherches sur la théorie de l'évolution : les comparaisons génétiques fournissent des indices très précieux pour savoir quelles sont les espèces les plus proches et comment les différentes familles se sont formées.

Alors, pour en revenir au titre, pourquoi cette discipline me cause-t-elle des soucis ? Tout simplement parce que traiter des données, les analyser, en optimiser l'accès et chercher de nouvelles techniques adaptées à des problèmes donnés, c'est ce que je fais depuis plus de cinq ans des statistiques de forums de discussion [4]. Sur le fond, ça n'a pas grand chose à voir, mais en terme centre d'intérêt ça a beaucoup de choses en commun. La preuve est que les cours de bioinformatique me passionnent. Or, la bioinformatique est une activité essentiellement orientée dans la recherche fondamentale, et la recherche fondamentale s'appuie essentiellement sur le secteur publique. Cela signifie que se lancer dans une carrière de bioinformaticien revient à courir après des CDD souvent courts et mal payés auprès des laboratoires français (voire étrangers, car le nombre de places est très limité). Au bout de plusieurs années de lutte, si tout va bien, on peut espérer réussir un concours dans la fonction publique ou trouver une place dans le privé en faisant valoir son expérience... Voilà matière à réfléchir à deux fois avant de s'engager, surtout lorsqu'on voit le taux d'emploi en CDI - presque 100% - dans les autres secteurs où je pourrais me diriger l'an prochain en Master Pro (réseau ou études et développement).

[1] Exemple de croissance uniquement pour les séquences de gènes sur le site du NCBI : http://www.ncbi.nlm.nih.gov/Genbank/genbankstats.html
[2] Recherches sur le site PubMed : http://www.ncbi.nlm.nih.gov/About/tools/restable_stat_pubmed.html
[3] Site officiel de Folding@Home : http://folding.stanford.edu/
[4] JVstats : http://jvstats.planet-shitfliez.org/site/rubrique.php?id_rubrique=1