Bioinfo

Bioinfo: Bio-informatique

La Bio-informatique est un champ de recherche multi-disciplinaire où travaillent de concert biologistes, informaticiens, mathématiciens et physiciens, dans le but de résoudre un problème scientifique posé par la biologie. Le terme bio-informatique peut également décrire (par abus de langage) toutes les applications informatiques résultant de ces recherches^[1]. Cela va de l'analyse du génome à la modélisation de l'évolution d'une population animale dans un environnement donné, en passant par la modélisation moléculaire, l'analyse d'image, le séquençage du génome et la reconstruction d'arbres phylogénétiques (phylogénie). Cette discipline constitue la « biologie in silico », par analogie avec in vitro ou in vivo.

Sommaire

1 Constitution et Portée

2 L'analyse de séquence

3 La modélisation moléculaire

4 Construction d'arbres phylogénétiques

5 La modélisation de population

6 Exemples de tâches/débouchés

7 Voir aussi

7.1 Articles connexes

7.2 Liens externes

7.3 Références

Constitution et Portée

La Bio-informatique est constituée par l'ensemble des concepts et des techniques nécessaires à l'interprétation de l'information génétique (séquences) et structurale (repliement 3D). C'est le décryptage de la « bio-information ». La bio-informatique est donc une branche théorique de la biologie^[2].

Il s'agit en fait d'analyser, modéliser ou prédire les informations issues d'activités de recherche.

Dans un sens encore plus étendu, on peut aussi inclure sous le concept de bio-informatique le développement d'outils de traitement de l'information basés sur des systèmes biologiques comme, par exemple, l'utilisation des propriétés combinatoires du code génétique pour la conception d'ordinateurs à ADN permettant de résoudre des problèmes algorithmiques complexes.

L'analyse de séquence

Alors que de plus en plus de séquences de génome, de transcriptome ou de protéome sont disponibles, la signification de la plupart de ces séquences reste à comprendre. La première difficulté a été d'organiser cette énorme masse d'information et de la rendre disponible à l'ensemble de la communauté des chercheurs. Cela a été rendu possible grâce à différentes bases de données, accessibles en lignes, comme GenBank, UniProt, PDB, etc. (cf. liens en fin d'article).

Il faut ensuite développer des outils d'analyse de séquences afin de pouvoir déterminer leurs propriétés.

Recherche de protéines à partir de la traduction de séquences nucléiques connues. Celle-ci passe par la détermination des phases ouvertes de lecture d'une séquence nucléique et de sa ou ses traduction(s) probables.

Recherche de séquences dans une banque de données à partir d'une autre séquence ou d'un fragment de séquence. Les logiciels les plus fréquemment utilisés sont de la famille BLAST (blastn, blastp, blastx, tblastx et leur dérivés).

Alignement de séquences : pour trouver les ressemblances entre deux séquences et déterminer leurs éventuelles homologies. Les alignements sont à la base de la construction de parentés suivant des critères moléculaires, ou encore de la reconnaissance de motifs particuliers dans une protéine à partir de la séquence de celle-ci.

Recherche de motifs ou structures consensus pour caractériser les séquences .

La bio-informatique intervient aussi dans le séquençage, avec par exemple l'utilisation de puces à ADN ou biopuce. Le principe d'une telle puce repose sur la particularité de reformer spontanément la double hélice de l’acide désoxyribonucléique face au brin complémentaire. Les quatre molécules de base de l'ADN ont en effet la particularité de s'unir deux à deux. Si un patient est porteur d'une maladie, les brins extraits de l'ADN d'un patient, vont hybrider avec les brins d'ADN synthétiques représentatifs de la maladie^[3].

La modélisation moléculaire

Les molécules de par leurs dimensions sont invisibles à tout moyen d'investigation direct tel que la microscopie. C'est par l'analyse de données indirectes que les chercheurs peuvent reconstituer un modèle moléculaire, c'est-à-dire une construction intellectuelle présentant la meilleure adéquation avec les résultats expérimentaux. Ces données sont issues principalement d'analyses cristallographiques (étude des figures de diffraction des rayons X par un cristal), de spectrométrie de masse, ou de résonance magnétique nucléaire. Elles représentent les contraintes expérimentales exercées sur le modèle. Le modèle moléculaire obtenu ensuite est un ensemble de coordonnées atomiques dans l'espace. L'informatique intervient dans toutes les étapes conduisant de l'expérimentation au modèle, puis ensuite dans l'analyse du modèle par la visualisation moléculaire (voir les protéines en 3D).

Un dernier aspect est la prédiction de la structure 3D d'une protéine à partir de sa structure primaire (la liste des acides aminés qui la composent), en modélisant les différentes caractéristiques des acides aminés. Cela a un grand intérêt car la fonction, l'activité d'une protéine dépendent grandement de sa forme. De même, la modélisation des structures 3D d'acides nucléiques (à partir de leur séquence nucléotidiques) revêt la même importance que pour les protéines.

La connaissance de la structure tri-dimensionnelle permet d'étudier les sites actifs d'une enzyme, mettre au point informatiquement une série d'inhibiteurs potentiels pour cette enzyme, et ne synthétiser et ne tester que ceux qui semblent convenir. Cela permet de réduire les coûts en temps et en argent de ces recherches.

De même la connaissance de cette structure permet de faciliter l'aligment de séquences protéiques.

La visualisation de la structure tridimensionnelle d'acides nucléiques (ARN et ADN) fait également partie de la palette des outils bio-informatiques très utilisés.

Construction d'arbres phylogénétiques

On appelle gènes homologues des gènes descendant d'un même gène ancestral. De façon plus spécifique, on dit de ces gènes qu'ils sont orthologues s'ils se retrouvent dans des espèces différentes (spéciation sans duplication), ou qu'ils sont paralogues s'ils se retrouvent chez la même espèce (duplication à l'intérieur du génome).

Il est alors possible de quantifier la distance génétique entre deux espèces en comparant leurs gènes orthologues. Cette distance génétique est représentée par le nombre et le type de mutations qui séparent les deux gènes.

Appliquée à un nombre plus important d'êtres vivants, cette méthode permet d'établir une matrice des distances génétiques entre plusieurs espèces. Les arbres phylogénétiques rapprochent les espèces qui ont la plus grande proximité. Plusieurs algorithmes différents sont utilisés pour tracer des arbres à partir des matrices de distance. Ils reposent chacun sur des modèles de mécanismes évolutifs différents. Les deux méthodes les plus connues sont la méthode UPGMA et la méthode du Neighbour Joining mais il existe d'autres méthodes basées sur le Maximum de Vraisemblance et le Bayésien Naïf.

La construction d'arbres phylogénétiques est utilisée par les programmes d'alignements multiples de séquences afin d'éliminer une grande partie des alignements possibles et de limiter ainsi les temps de calcul : il permet ainsi de guider l'alignement total.

La modélisation de population

Exemples de tâches/débouchés

Voici un exemple de tâches/débouchés réalisés par plusieurs étudiants et professeurs ^[4]

Aide à la création de nouveaux médicaments (prédiction de structure, d'interactions)

Développement de logiciels pour l'analyse et prédiction de données biologiques (génomique, transcriptomique, proteomique, etc)

Développement de logiciels pour la biologie : (LIMS, interface web, etc)

Recherche dans un laboratoire (entreprise publique, biotechs, pharmaceutique, etc).

Modélisation d'écosystèmes ou de processus écosystémiques (du gène au réseau écologique)

Modélisation physiologique et simulation informatique d'organes

Informatique pure

Aide à la création d'Organismes Génétiquement Modifiés (bactéries, plantes, etc)

Aide à la création de tests et de systèmes de diagnostics destinés aux laboratoires d'analyses médicales, aux centres de transfusion sanguine et aux laboratoires de contrôle industriel

Enseignement

Adaptation de technologies informatiques au domaine de la biologie

Création, entretien et développement d'entrepôts de données

Utilisation de logiciels pour l'analyse et prédiction de données biologiques (génomique, transcriptomique,proteomique, etc)

Voir aussi

Voir « bio-informatique » sur le Wiktionnaire.

Articles connexes

Biologie

Informatique

Institut européen de bio-informatique

National Center for Biotechnology Information

Liens externes

Société Française de Bioinformatique (SFBI ; société savante créée en 2005 par des chercheurs et enseignants-chercheurs en bioinformatique).

Institut Suisse de Bioinformatique (ISB ; institut créé en 1998 pour regrouper les chercheurs en bio-informatique en Suisse).

Sélection de sites web sur la bioinformatique dans le répertoire encyclopédique : Les Signets de la Bibliothèque nationale de France

Masters Bioinformatique :

Belgique : ULB, Bruxelles

Canada : UQAM, Montréal

France : Bordeaux, Evry, Lille, Montpellier, Nantes, Paris 6, Paris 7, Paris 11, Rennes, Rouen, Strasbourg, Toulouse, Versailles

Références

↑ Tout comme l'informatique peut être considérée, suivant les situations, comme une science ou comme une technologie.

↑ Jean-Michel Claverie, « La bioinformatique : une discipline stratégique ». Consulté le 7 janvier 2009

↑ Jean-Baptiste Waldner, Nano-informatique et Intelligence Ambiante - Inventer l'Ordinateur du XXIe Siècle, Hermes Science, London (réimpr. 2007), 121 p. (ISBN 2746215160)

↑ Site des Etudiants de la filière de BioInformatique et BioStatistiques d'Orsay (Description, Ressources, Wiki, et forum sur la bioinformatique)

Domaines généraux de la biologie

Anatomie | Biochimie | Bio-informatique | Biologie cellulaire | Biologie de l'évolution | Biologie humaine | Biologie marine | Biologie moléculaire | Botanique | Écologie | Exobiologie | Génétique | Géobiologie | Microbiologie | Origines de la vie | Paléontologie | Parasitologie | Physiologie | Taxinomie | Zoologie

Portail de la biologie

Portail de la biologie cellulaire et moléculaire

Portail de l’informatique

Ce document provient de « Bio-informatique ».

Catégorie : Discipline de la biologie

Contenu soumis à la licence CC-BY-SA. Source : Article Bioinfo de Wikipédia en français (auteurs)

Игры ⚽ Поможем решить контрольную работу

Regardez d'autres dictionnaires:

Protein Analysis Subcellular Localization Prediction — Protein (or in general, proteome) Analysis Subcellular Localization Prediction is a process (usually through the use of web based software) of predicting the location or destination of a protein within the cell using only the protein sequence as… … Wikipedia
Marshall-Smith syndrome — Discovered in 1971 (Marshall, Graham, Scott, Boner, Smith). Marshall Smith Syndrome is characterized by unusual accelerated skeletal maturation (usually starting before birth) and symptoms like conspicuous physical characteristics, respiratory… … Wikipedia
Lereim — Paul Jostein Lereim (* 15. September 1938) ist Professor für Orthopädie an der Universität Oslo. Paul Lereim stammt aus einer Priesterfamilie. Er studierte Medizin in Innsbruck und Kiel und war danach der letzte Direktor des orthopädische… … Deutsch Wikipedia
Yass (software) — YASScite journal |author=Noe L., Kucherov. G.|title=YASS: enhancing the sensitivity of DNA similarity search |journal=Nucleic Acids Research |volume=33|issue=2 |pages=W540 W543 |year=2005 |doi=10.1093/nar/gki478 |pmid=15980530] cite journal… … Wikipedia
Protein structure prediction — is one of the most important goals pursued by bioinformatics and theoretical chemistry. Its aim is the prediction of the three dimensional structure of proteins from their amino acid sequences, sometimes including additional relevant information… … Wikipedia
BioMOBY — is a registry of web services used in bioinformatics. It allows interoperability between biological data hosts and analytical services by annotating services with terms taken from standard ontologies. The BioMOBY project The [http://biomoby.org… … Wikipedia
Goose Guandong virus — The Goose Guandong virus refers to the strain A/Goose/Guangdong/1/96 (Gs/Gd) like H5N1 HPAI viruses. It is a strain of the Influenzavirus A subtype H5N1 virus that was first detected in a goose in Guangdong in 1996. It is an HPAI (High Pathogenic … Wikipedia
Pomphorhynchus laevis — Taxobox image caption = P. laevis uses this barbed appendage to hook onto its hosts. name = Pomphorhynchus laevis regnum = Animalia phylum = Acanthocephala classis = Palaeacanthocephala ordo = Echinorhynchida familia = Pomphorhynchidae genus =… … Wikipedia
Ralph W. Gerard — Infobox Systems scientist region = General Systems Theory era = 20th century color = #B0C4DE image caption = name = Ralph Waldo Gerard birth = October 7 1900, Harvey, Illinois, USA | death = February 17 1974, USA school tradition = University of… … Wikipedia
List of bioinformatics journals — This is a non sorted list of scientific journals that regularly publish papers on bioinformatics issues. There was no intention to judge, sort, rank or endorse any of these items in this list.It is important to note that several journals covering … Wikipedia

Dictionnaires et Encyclopédies sur 'Academic'

Bioinfo

Bio-informatique

Sommaire

Constitution et Portée

L'analyse de séquence

La modélisation moléculaire

Construction d'arbres phylogénétiques

La modélisation de population

Exemples de tâches/débouchés

Voir aussi

Articles connexes

Liens externes

Références

Regardez d'autres dictionnaires:

Share the article and excerpts

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

Bioinfo

Bio-informatique

Sommaire

Constitution et Portée

L'analyse de séquence

La modélisation moléculaire

Construction d'arbres phylogénétiques

La modélisation de population

Exemples de tâches/débouchés

Voir aussi

Articles connexes

Liens externes

Références

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link