Rapport

Rapport

2ème année Bio-inlormatique Année scolaire valentin SABATFT Maitre de stage M. Harm NIJveen Superwlseur W Sanchez Perez Rapport de stage Développement dun outil web permettant la visualisation des profils de „ Angles Inscrits Au Centre I Premium GY Angles Inscrits, au centre A sa»qJIr (C) est un cercle de centre O. définitions : L’angle AMB est appelé angle inscrit dans L’angle ANB aussi. L’angle AOB est l’angle au centre associé à cet angle inscrit. On dit que ces 3 angles interc„. Apprentissage Moteur Claudie MINISTERE DE LEDLJCAT’DN NATIONALE REPugLlQuE DE COTE D’IVOIRE ET DE L’ENSEIGNEMENT suPERlEUR Union – Discipline – Travail Etude clinique de l’effet des carraghénanes sur l’organisme des chats Présentation Les polysaccharides sulfatés ont été trés largement étudiés ces dernières années principalement pour leurs propriétés antivirales contre de Virus enveloppés tels que le Virus de (HSV), le Virus de Premiurr.

SFSSION 2 BACCALAURFAT PROFESSIONNFL FPRFUVF OF FRANÇAIS (L’usage du dictionnaire et de la calculatrice est interdit) Coefficient: Durée: 2h30 AP 1206-BHG kR -1 Page I sur 3 Évaluation des compétences de lecture (IO „ Notes De Elcture un Homme Et Son P Ch onservation, qui correspond à révolution de leur protéome, peut être défini. Un outil web a été

Désolé, mais les essais complets ne sont disponibles que pour les utilisateurs enregistrés

Choisissez un plan d'adhésion
développé pour pouvoir les visualiser.

Il dispose d’une série de paramètres varlables, qui permet de générer dynamiquement n’importe quel profil de conservation. par conséquent, il permet émettre des hypothèses quant à la manière dont ces organismes s’adaptent en regardant comment leur séquence a évolué. De plus, des applications externes sont possibles, notamment dans le domaine de l’industrie. Par exemple, le logiciel permettrait théoriquement de faire économiser énormément ‘argent en processus de recherches dans l’industrie du détergent.

Abstract Extremophilic prokaryotes are organisms living in extreme environments (high or low temperature, pressure, pH How they can adapt to such living conditions and environment is still unclear, and current methods do not allow to understand it more. With this in mind, a new approach has been implemented. It uses the protein sequence of an organism to calculate how it has changed compared With others extremophiles, based on the change of each amino acids. Thus, their conservational profile, which corresponds to changes in their proteome, can be efined.

A web tool has also been developed to visualize them. ThlS software has different parameters, which allow to dynamically generate any conservational profile. Therefore, it allows to make hypothesis about how these organisms adapt, just by looking at how their sequence has evolved. Moreover, there pplications, especially in PAGF SOMMAIRE Introduction 2 Présentation du contexte . L’entreprise . 1. 2 Les procaryotes extrêmophiles 1. 3 Le profil de conservation des protéines Matériel et méthodes 4 2. Le « pipeline » _ 2. 4. 2 Import de génomes 9 2. 4. 3 Mise à jour automatique de la base de onnées • 10 Usage et applications 12 3. 1 Utilisation du logiciel 3. 2 Domaines d’application 13 3. 3 Cas pratiques 15 33. 1 procédés actuels. Actuellement, une méthode était utilisée pour connaitre le taux d’évolution du protéome des espèces, en prenant en compte la variation du pourcentage de chaque acide aminé entre les différents génomes, mais cette méthode n’a pas obtenu de résultats convaincants.

Cest pour cela qu’une nouvelle méthode a été mise au point, qui prend cette fais ci chaque site protéique, c’est-à-dire chaque acide aminé, comme étant un facteur à part entière dans ‘évolution du protéome. De cette façon, il est possible de dresser le profil de conservation de chaque acide aminé. un outil de visualisation de ces profils de conservation a alors été créé, pour permettre de tester toutes les combinaisons possibles des paramètres (caractéristiques génomiques, composition, et ainsi obtenir des informations sur la manière dont chaque organisme évolue.

Comment fonctionne cette nouvelle méthode et l’outil qui lui est reliée ? Comment peut-il apporter les informatlons nécessaires à la mise en place d’hypothèses sur la capacité d’adaptation es organismes ? Dans une première partie, il sera présenté le contexte biologique, avec les connaissances actuelles sur le sujet, ainsi que le contexte de travail, avec la présentation de l’entreprise responsable du stage.

La seconde partie introduira le fonctionnement de l’outil web, et la troisième et dernière partie montrera les nombreuses applications qu’il offre. 1 Présentation du contex PAGF s OF VHL, une université en sciences appliquées, faisait également partie de ce consortium. L’association ainsi formée est organisée en cinq branches, représentatives d’un domaine pécifique : agrotechnologies, biologie animale, sciences environnementales, biologie végétale et sciences sociales.

Pour chacun de ces secteurs, un ou plusieurs laboratoires y sont reliés. Wageningen UR s’est donné pour mission « d’explorer le potentiel de la nature pour améliorer la qualité de vie et de devenir, d’ici 2020, le principal centre de recherche en Europe et un partenaire mondlal dans les recherches portant sur la qualité de nutrition et l’amélioration du cadre de vie. pour réaliser ces objectifs, 6 500 employés ont été recruté, et 10 000 étudiants de plus de 00 nationalités différentes y sont formés.

Plant Research International est un laboratoire associé à la filière de la biologie végétale, et qui a pour devise : « Utiliser les propriétés et les posslbilltés données par les plantes pour résoudre des problèmes sociaux Ses recherches portent donc essentiellement sur la qualité de la nutrition. Parmi les projets en cours de réalisation, certains ont une application très importante : Développement d’une plante capable de tolérer des environnements secs, des sols salins ou encore qui nécessite moins de phosphate ; Remplacement des traite

PAGF OF es du bois par l’utilisation externes non négligeables. C’est ainsi que j’ai été amené à travailler sur les procaryotes extrêmophiles, en reprenant le projet de fin de master d’un étudiant afin de le continuer et le finaliser. pour cela il a fallu créer un outil web complet, adapté à la visualisation des profils de conservation en acides aminés. -2- 1 . 2 Les procaryotes extrêmophiles Contrairement aux Hommes, les procaryotes peuvent se trouver dans n’importe quel endroit sur Terre, peu importe qu’il y ait un fort ou fable pH, température, pression, salinité ou osmolarité.

Les organismes vivant dans ce genre de conditions sont appelés extrêmophiles, et ce sont essentiellement des bactéries. Comment il leur est possible de vivre ainsi est une question importante dans la recherche biologique, car les applications qui en peuvent en découler sont très variées. Il est connu que pour survivre dans des conditions extrêmes, chaque protéine du procaryote doit garder ses fonctions pour que le génome reste intact, mais elle doit également s’adapter à son environnement.

La clé de cette adaptation résiderait donc dans la modification de la composition u protéome de ces organismes, c’est-à-dire dans la composition de ses protéines, et donc de ses acides aminés. 1. 3 Le profil de conservation des protéines Le protéome de chaque espece est en constante évolution, de façon à s’adapter à son environnement. S’il est possible de déterminer les acides aminés qui ne sont iamais modifié PAGF 7 OF peuvent permettre l’adaptation des espèces extrêmophiles à leur milieu.

Pour identifier le taux d’évolution de chaque site protéique, il faut d’abord réaliser un alignement des protéines homologues. Il est alors clairement isible que certains acides aminés varient fortement, contrairement à d’autres qui ne changent pas (Cf. figure 1). A partir de cet alignement, chaque position a été classé de 1 à 8, allant d’une variation faible à une plus forte. Ensuite, il suffit d’appliquer certains algorithmes phylogénétiques afin de pouvoir calculer leur évolution. Les précédentes études du profil de conservation des protéines n’ont pas été vraiment concluantes (Baker-Austin C, 2007).

La démarche scientifique utilisée dans ces recherches était de trouver une corrélation entre la variation globale du taux de haque acide aminé et la capacité d’adaptation au milieu. C’est à partir de ces résu tats qu’une nouvelle méthode a été développée, -3- plus précise, en prenant cette fois-ci comme référence la variation de chaque position comme facteur de l’évolution. 2 Matériel et méthodes 2. 1 Le « pipeline » pour implémenter cette nouvelle méthode, un « pipeline » a été développé par l’étudiant en master. C’est un logiciel, écrit en perl (Cf. nnexe 1), qui consiste en un ensemble de fonctions permettant, in fine, de calculer le rofil de conservation en tilisant chaque site proté- PAGF BOF ensuite été utilisé (Feature frequency profi es ou FFP), afin d’éliminer les espèces trop proches, qui ne serait pas utiles ? analyser, et qui permet ainsi de gagner en performance pour le logiciel ; Basic Local Alignment Search Tool ou BLAST Algorithme qui, à partir d’une base de données définie (ici l’ensemble des génomes sélectionnés) et d’un ensemble d’options, va permettre dy comparer une séquence afin de déterminer un allgnement optimal entre ces derniers.

Une fois terminé, une vérification des alignements trouvés est ffectuée, pour ne sélectionner que ceux qui pourraient être intéressant, à savoir ceux qui présentent une bonne qualité (entre 0,85 et 1. 15), et un pourcentage d’identité pas trop élevé (< 95%) ; Création d'arbres phylogénétiques : En utilisant des algorithmes phylogénétiques préétablis (Neighbor-Joining), le « pipeline » crée un arbre permettant de visualiser le degré de parenté entre chaque génome utilisé.

Ce premier arbre entre dans la confection d’un second, plus précis (Maximum Likelihood), qui, en se basant sur le premier, va aider à calculer directement le aux d’évolution des sites protéiques (Schmidt, Korbinian et al. 2003). protéique en fonction de son évolution, comparée à celle de l’ensemble des génomes extrêmophiles étudiés.

Ces résultats vont ensuite être utilisés pour créer une base de données regroupant toutes les informations nécessaires à la visualisation des profils de conservation 2. 2 La base de données A partir de là, il a été possible, grâce à un script Perl, de transformer les fichiers résultats en un fichier Excel comportant le taux d’évolution relatif ainsi que le pourcentage d’acides aminés (Cf. figure 4).

Pour cela, le fichier résultat de chaque espèce a été parcouru comme suit • le fichier a été découpé en 25 cases qui vont donner les 25 coordonnées du profil de conservation ; La valeur médiane de chaque case correspond à la précision de la case, et son log en base 2 est utilisé comme taux relatif d’évolution pour cette case ; Le calcul du pourcentage de chaque aminé dans chaque case est effectué, en fonction de la quantité de cette acide aminé comparé au nombre total d’acides aminés dans la case. Ces coordonnées sont insérées dans une base de données ? l’aide d’un script PHP, afin