Tài liệu Développement d'un portail web pour le criblage virtuel sur la grille de calcul

.PDF

149

101

nhattuvisu Báo vi phạm

Tải xuống 101

Mô tả:

Institut de la Francophonie pour l’Informatique Mémoire de fin d’études pour l’obtention du diplôme de Master II Informatique Option : Réseaux et Systèmes Communicants Développement d’un portail web pour le criblage virtuel sur la grille de calcul Promotion 17-RSC Rédigé par : Louacheni Farida Sous l’encadrement de : Dr.Nguyen Hong Quang Dr.Doan Trung Tung Dr.Bui The Quang 20 novembre 2014 Remerciements Ce travail de stage de fin d’études a été effectué au sein du Laboratoire MSI à l’Institut de la Francophonie pour l’Informatique, sous la direction du Docteur Nguyen Hong Quang, auquel je tiens à exprimer ma profonde gratitude, et ma vive reconnaissance pour m’avoir confié ce sujet. J’adresse mes plus vifs remerciements au Dr.Doan Tung Tung et Dr.Quang Bui The de m’avoir encadré et prodigué maints conseils. Je suis très reconnaissante à tous les enseignants de l’IFI pour la qualité de l’enseignement qu’ils nous ont offerts. Ma reconnaissance infinie à mes très chers parents qui m’ont enseigné la persévérance dans mes études, qui m’ont toujours été d’un grand secours par leur soutient et leur encouragement, ainsi mes adorables soeurs et mon très cher frère et mon ami Yacine-Malek. Enfin, un immense merci à mes amis qui m’ont toujours soutenue. i Résumé À l’heure actuelle, la grille de calcul est en train de devenir une force motrice majeure pour de nouvelles approches pour la collaboration de science à grande échelle. Plusieurs programmes nationaux et internationaux eScience ont favorisé la collaboration entre chercheurs de différents domaines scientifiques. Dans le domaine biomédicale, plus précisement dans la recherche de nouveaux médicaments pour les maladies infectieuses. La grille de calcul a initié plusieurs projets à grande échelle dans les approches de criblage de médicaments in-silico. Le projet WISDOM a été parmi les premiers projets dans le domaine public qui a fait usage de la grille tout en permettant le docking in-silico pour simuler l’interaction de médicaments potentiels avec des protéines cibles. Le docking in-silico est la première étape dans le processus de criblage virtuel, il est considéré comme l’une des approches les plus prometteuses afin accélérer et de réduire les coûts de développement de nouveaux médicaments pour les maladies négligées. Bien que, de nombreuses applications ont été développées pour permettre le criblage virtuel dont le but d’accélérer le processus de recherche des médicaments. Une barrière critique de ces programmes est leur complexité en terme d’utilisation et de prévoir des procédures concises pour les utilisateurs réguliers. L’objectif de ce travail est de développer un portail web conviviale pour effectuer le criblage virtuel, et de déployer un très grand nombre de docking sur la grille de calcul. Pour atteindre ce but, la grille de calcul a été utilisé pour accélérer la recherche et la découverte de nouveaux médicaments in-silico et traitements pour les maladies infectieuses. ii Abstract Grid computing is currently developing into a major driving force for new approaches towards collaborative large scale science. Several national and international eScience programs have fostered collaboration between researchers from different scientific domains. In the biomedical field, more precisely in drug discovery for infectious diseases. Grid computing has initiated several projects on large scale in-silico drug screening approaches. The project WISDOM was amongst the first projects in the public domain that made use of grid enabled in-silico docking to simulate the interaction of potential drugs with target proteins. In-silico docking is the first step in the virtual screening process, which is one of the most promising approaches to speed-up and to reduce the costs of the development of new drugs. Although, many applications have been developed to allow in-silico screening, but a critical barrier of these programs is the lack of a suitable, easy, simple way to use and to provide concise procedures for regular users. The main goal of this work is to develop a user-friendly web portal to perform virtual screening and to deploy a large number of docking on grid computing. To achieve this goal, the grid computing was used to accelerate research and discovery of new drugs in-silico for infectious diseases. iii Table des matières 1 Introduction 1.1 Problèmatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Notre contribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Plan du mémoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 État de l’art 2.1 Conception de médicaments in-silico . . . . . . . . . . . . . 2.2 Criblage virtuel ”Vitual Screening” . . . . . . . . . . . . . . 2.2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Découverte de nouveaux médicaments avec le criblage 2.2.3 Les différentes stratégies du criblage virtuel . . . . . 2.2.4 Criblage virtuel à haut débit . . . . . . . . . . . . . 2.2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Docking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Approches du docking . . . . . . . . . . . . . . . . . 2.3.3 Principe du docking . . . . . . . . . . . . . . . . . . 2.3.4 Outils de Docking . . . . . . . . . . . . . . . . . . . . 2.3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . 2.4 AutoDock . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Docking avec AutoDock . . . . . . . . . . . . . . . . 2.4.2 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Grille de calcul . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . 2.5.2 Grille de calcul . . . . . . . . . . . . . . . . . . . . . 2.5.3 Organisation virtuelle . . . . . . . . . . . . . . . . . . 2.5.4 Architecture générale d’une grille de calcul . . . . . . 2.5.5 Composants de la grille . . . . . . . . . . . . . . . . . 2.5.6 Fonctionnement de la grille . . . . . . . . . . . . . . 2.5.7 Avantages & Défis de la grille . . . . . . . . . . . . . 2.5.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Portail GVSS . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . 2.6.2 La plate-forme GAP . . . . . . . . . . . . . . . . . . 2.6.3 Architecture GVSS . . . . . . . . . . . . . . . . . . . 2.6.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Plate-formes utilisés . . . . . . . . . . . . . . . . . . . . . . 2.7.1 WISDOM . . . . . . . . . . . . . . . . . . . . . . . . 2.7.2 DIRAC . . . . . . . . . . . . . . . . . . . . . . . . . i . . . . . . . . . . . . virtuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 2 2 3 3 4 4 6 6 7 7 9 9 10 11 12 13 14 15 17 18 18 18 19 20 21 22 24 24 26 26 27 28 29 30 30 33 3 Implémentation 3.1 Architecture du système proposée 3.2 Outils utilisés . . . . . . . . . . . 3.3 Conception du portail . . . . . . 3.4 Développement du portail du web 3.4.1 Les services web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 37 38 41 48 48 4 Expérimentation & Résultats 52 4.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 5 Conclusion & perspective 64 ii Table des figures 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 Processus de conception de médicaments in-silico [11] . . Criblage Virtuel in-silico . . . . . . . . . . . . . . . . . . Docking protéine-ligand . . . . . . . . . . . . . . . . . . Étapes du Docking . . . . . . . . . . . . . . . . . . . . . Illustration de docking/scoring [6] . . . . . . . . . . . . . Comparaison des programmes de docking [16] . . . . . . Procédures de docking avec AutoDock . . . . . . . . . . La grille de calcul . . . . . . . . . . . . . . . . . . . . . . Couches de la grille de calcul . . . . . . . . . . . . . . . . Architecture de grille de calcul [10] . . . . . . . . . . . . Portail GVSS . . . . . . . . . . . . . . . . . . . . . . . . Architecture Service de criblage virtuel GAP (GVSS) [7] Architecture WPE [9] . . . . . . . . . . . . . . . . . . . . Intergiciel DIRAC . . . . . . . . . . . . . . . . . . . . . . Architecture DIRAC [20] . . . . . . . . . . . . . . . . . . Architecture du système proposée . . . . . . . . . . . . . Workflow soumission de job sur la grille avec Taverna . . Diagramme de classe du portail web . . . . . . . . . . . . Cas d’utilisation pour le Ligand . . . . . . . . . . . . . . Cas d’utilisation pour la Protéine . . . . . . . . . . . . . Cas d’utilisation pour les paramètres de grille . . . . . . Cas d’utilisation pour le docking . . . . . . . . . . . . . . Cas d’utilisation pour l’administrateur du portail . . . . Modèle MVC . . . . . . . . . . . . . . . . . . . . . . . . Description des services web implémentés . . . . . . . . . Workflow des services web du portail . . . . . . . . . . . Interface d’accueil du portail web . . . . . . . . . . . . . Interface de création d’un nouveau compte . . . . . . . . Interface d’authentification . . . . . . . . . . . . . . . . . Interface de gestion des utilisateurs . . . . . . . . . . . . Interface d’ajout d’un nouveau Ligand . . . . . . . . . . Interface de liste des Ligands disponibles . . . . . . . . . Interface de gestion des protéines . . . . . . . . . . . . . Interface de modification d’une protéine . . . . . . . . . Interface d’ajout de fichier de paramètres de la grille . . Interface d’ajout d’un nouveau projet de docking . . . . Vérification d’ajout du nouveau projet . . . . . . . . . . Soumission de job de docking . . . . . . . . . . . . . . . Téléchargement du résultat de docking . . . . . . . . . . iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 5 10 11 12 13 15 19 21 23 27 29 31 33 35 38 39 42 43 44 45 46 47 48 49 51 52 53 53 54 54 55 55 56 56 57 57 58 58 40 41 42 43 44 45 46 47 Fichier log de docking ”dlg” . . . . . . . . . . . . . . . Soumission du projet de docking ProjectZinc1OKE . . Téléchargement du résultat de docking . . . . . . . . . Enregistrement du résultat du job sur la grille de calcul Les fichiers dlg & glg du docking . . . . . . . . . . . . . Les fichiers log de docking et de la grille dlg & glg . . . Téléchargement du résultat des jobs . . . . . . . . . . Les fichiers des jobs soumis en parallèle . . . . . . . . . iv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 59 60 60 60 61 62 63 1 Introduction Par le passé, un grand nombre de médicaments ont été découverts tout simplement grâce à l’identification de principes actifs extraits de substances naturelles historiquement utilisées dans la médecine non-conventionnelle, ou même par hasard, ce qu’on nomme ”sérendipité”. Mais plus le nombre de médicaments connus augmente et plus les probabilités de faire une telle découverte sont faibles. Par la suite, les avancées dans le domaine de la synthèse chimique ont conduit à une démarche de recherche systématique permettant l’élaboration de nouveaux médicaments de plus grande efficacité. La découverte de nouveaux médicaments ”drug discovery” est un processus extrêmement long et fastidieux, 12 à 15 ans peuvent s’écouler entre la découverte de la molécule et la mise à disposition du médicament auprès des patients. Les nouvelles méthodes permettant la découverte de nouveaux médicaments se doivent donc d’innover afin de mettre en évidence des molécules encore inconnues ayant un certain potentiel d’activité sur des cibles biologiques connues [Davis et al,2003]. Les outils mis en place doivent être capables de guider les chimistes médicinaux dans le choix des molécules à cribler et à synthétiser. Les stratégies de criblage virtuel, ou in-silico, sont donc depuis quelques années employées en tant qu’alternative ou de façon complémentaire. Ces techniques sont en général assez faciles à mettre en place, pour un coût bien moindre que les criblages expérimentaux. De plus, l’évolution technologique constante de ces dernières décennies a permis d’accélérer considérablement le temps de calcul nécessaire à la simulation de systèmes complexes ou de bases de données de plusieurs milliers de molécules. Le criblage virtuel est donc aujourd’hui employé dans de nombreux projets, afin de sélectionner, au sein de vastes librairies de molécules, un nombre restreint de composés à cribler expérimentalement. 1.1 Problèmatique L’axe principal de ce travail se situe dans le domaine de bio-informatique. Plus précisement dans la recherche et la découverte de nouveaux médicaments pour les maladies dangereuses comme : HIV, Ebola, fièvre de dengue,..., par le biais de techniques informatiques. Le défi se situe au niveau de la conception de nouveaux médicaments, qui est un processus long et très onéreux, et au niveau du déployement d’un grand nombre de docking sur la grille de calcul. Cependant, les outils existants sont en manque de moyen simple pour fournir des procédures concises pour les utilisateurs réguliers (biologistes, chimistes, etc) afin d’arranger les ressources pour mener un amarrage moléculaires massif. Par conséquent, ces derniers rencontrent plusieurs difficultés et problèmes lors de l’utilisation de ces applications, ce qui entraı̂ne une grande perte de temps et d’argent afin d’accélérer la recherche de nouveaux traitements pour les maladies négligées. 1 1.2 Notre contribution Notre contribution repose sur le développement d’un portail web pour le criblage virtuel en utilisant la grille de calcul pour faciliter la découverte et la recherche de nouveaux médicaments pour les maladies graves et négligées. Nous proposons une interface conviviale et facile à utiliser pour les utilisateurs non-expérimentés (chimistes, biologistes, médecins....) en informatique et en grille de calcul. Afin de favoriser l’intéropérabilité entre le portail web et les services de grille de calcul, nous proposons une architecture qui permettra une analyse et un traitement fiable des requêtes des utilisateurs finaux. 1.3 Plan du mémoire Ce mémoire sera organisé en 4 parties présentant respectivement : l’état de l’art, implémentation & conception, démonstration & résultats, conclusion & perspectives. Dans la première partie, un état de l’art est présenté qui passe en revue le criblage virtuel, le docking, suivie de l’outil AutoDock. Ensuite nous abordons la technologie de grille de calcul, le portail GVSS et les plate-formes WISDOM qui est déployée dans la découverte de nouveaux médicaments et DIRAC. La deuxième partie du mémoire présente l’implémentation du portail, qui se focalisera sur l’architecture proposée, la conception et l’implémentation du portail. L’avant dernière partie porte sur la démonstration du portail muni des résultats obtenus. À la fin, ce mémoire ce termine par une conclusion générale et quelques perspectives. 2 2 État de l’art Aujourd’hui, les projets scientifiques produisent et analysent une quantité d’information sans précédent, ce qui nécessite une puissance de calcul jamais vue auparavant. Les leaders dans ce défi de traitement de données sont les expériences du LHC au CERN, qui accumulent des dizaines de pétaoctets de donnés chaque année. Cependant, il se révèle que d’autres domaines scientifiques s’approchent aussi de ces limites. Par conséquent les utilisateurs devons exploiter les ressources disponibles à travers le monde de manière aisée et facile. Plusieurs travaux existent qui illustrent le développement et le déploiement des applications sur l’infrastructure de la grille de calcul, et qui ont montré une utilisation efficace des ressources de cette dernière. Les utilisateurs sont rarement experts en informatique et en grille de calcul. Pour cette raison ils ont besoin d’un moyen qui facilite l’accès aux ressources de la grille dont ils ont besoins d’un coté, et qui cache la complexité de l’infrastructure sous-jacente de l’autre coté. Dans cette partie, nous allons décrire en détail la technique du criblage virtuel ainsi l’amarrage ”Docking”, le principe de la grille de calcul et son rôle dans la découverte de nouveaux médicaments pour les maladies négilgées et dangereuses. Puis, nous présentons le portail GVSS et la plate-forme WISDOM déployer pour accéder aux services de grille de calcul et DIRAC. • Nomenclature – Ligand, une structure, généralement une petite molécule qui se lie à un site de liaison. – Récepteur, une structure, généralement une protéine qui contient le site de liaison actif. – Site de liaison, zones de protéines actives qui interagissent physiquement avec le ligand pour la formation d’un composé. 2.1 Conception de médicaments in-silico La conception de médicaments assistée par ordinateur emploie la chimie computationnelle pour la découverte, l’amélioration et l’étude de médicaments et molécules biologiquement actives. En effet, l’outil informatique aide la conception de médicaments à des étapes spécifiques du processus : • Dans l’identification des composés potentiellement thérapeutiques, en utilisant le criblage virtuel ”virtual screening”. • Dans le processus d’optimisation de l’affinité et de la sélectivité des molècules potentielles vers les têtes de série ”lead” ou appelés encore prototypes. • Dans le processus d’optimisation du lead de série par rapport aux propriétés pharmacologiques recherchées tout en maintenant une bonne affinité de cette molécule. 3 Toutes ces étapes d’intervention de l’outil informatique sont présentées dans le schéma récapitulatif suivant. Figure 1 – Processus de conception de médicaments in-silico [11] 2.2 Criblage virtuel ”Vitual Screening” L’identification d’une cible pharmaceutique peut se faire par différentes méthodes. Une fois la cible identifiée diagnostiquée, il faut tester un ensemble de molécules candidates sur cette cible, selon un processus qualifié de screening. On distingue deux types de criblage : le criblage virtuel, qui est réalisé in-silico , tout en permettant la réalisation de manière rapide et à moindre coût des prédictions de l’activité des molécules. Et le criblage réel à haut débit, quand à lui il permet de tester rapidement ”in-vitro” l’activité de composés biologiques, et cela est limité par le nombre de composés à tester en un temps raisonnable et par le coût des tests. 2.2.1 Introduction Le terme criblage virtuel ou ”Virtual Screening” regroupe un ensemble de techniques computationnelles ayant pour objectif l’exploration de bases de composés à la recherche de nouvelles molécules. Une analogie souvent utilisée compare ces techniques à des filtres qui permettraient de constituer des ensembles de molécules partageant certaines propriétés et de sélectionner les plus susceptibles d’interagir avec une cible donnée [13]. Aujourd’hui, le criblage virtuel est largement utilisé pour identifier de nouvelles substances bio-active et pour prédire la liaison d’une grande base de donnée de ligands à une cible particulière, dans le but d’identifier les composés les plus prometteurs. Il s’agit d’une méthode qui vise à identifier les petites molécules pour l’interaction avec les sites de protéines cibles afin de faire des analyses et des traitements ultérieures. Plus précisement, le criblage virtuel est défini comme l’évaluation automatique de très grandes banques de composés à l’aide de programmes informatiques, il se référe à une série in-silico, qui est une 4 technique effectuer à base d’ordinateur ou par l’intermédiaire des modèles mathématiques et des simulations informatique, qui aide dans la découverte de nouveaux médicaments et de déterminer de nouveaux composés les plus susceptibles pour se lier à une molécule cible d’une structure 3D connue [2]. Figure 2 – Criblage Virtuel in-silico (http: // serimedis. inserm. fr ) Compte tenu de l’augmentation rapide du nombre de protéines, le criblage virtuel continue à croitre comme une méthode efficace pour la découverte de nouveaux inhibiteurs et de nouveaux médicaments. Il est utilisé dans les premières phases du développement de nouveaux médicaments. Il a pour but de sélectionner au sein de chimiothèques varièes des ensembles réduits de molécules dont le potentiel d’activité envers la cible thérapeutique visée est supérieur à celui des autres molécules [Enyedy Egan, 2008], c-à-d, les molécules qui peuvent influencer l’activité de la protéine cible. Dans ce cas, le criblage a pour objectif l’identification des motifs structuraux essentiels dans la liaison ligand-récepteur, et la discrimination des meilleurs composés au sein de chimiothèques orientées comprenant des molécules appartenant à une même série. Le criblage virtuel est très utile et considéré comme un outil efficace pour accélérer la découverte de nouveaux traitements et la recherche des bibliothèques de petites molécules afin d’identifier les structures qui sont les plus susceptibles de se lier à une cible de médicament, généralement un récepteur de protéine [14]. Il dépend de la quantité d’information disponibles sur la cible d’une maladie particulière. Les techniques de criblage virtuel sont devenues des outils indispensables dans la chimie médicinale qui offrent un moyen d’améliorer la phase de découverte de médicaments. Elles sont utilisées de manière quotidienne aussi bien dans les laboratoires de recherche publics que dans les grands laboratoires pharmaceutiques. 5 2.2.2 Découverte de nouveaux médicaments avec le criblage virtuel Le criblage virtuel est la stratégie in-silico la plus utilisée pour l’identification de composés (”hits”) dans le cadre de la recherche de nouveaux médicaments. Celui-ci fait désormais partie intégrante de la plupart des programmes de recherche de composés bioactifs, que ceux-ci se déroulent en milieu académique ou industriel, car il constitue un complément essentiel au criblage biologique haut-débit. Le criblage virtuel permet l’exploration de grande chimiothèques ( > 106 molécules) à la recherche de composés actifs vis-à-vis d’une cible thérapeutique donnée. Ce processus vise à réduire de façon significative la chimiothèque de départ à une liste limitée de composés jugés les plus prometteurs. Cette approche conduit souvent à une nette amélioration de la ”concentration” de molécules actives pour la cible ”hit-rate”, tandis qu’une sélection aléatoire de molécules de la chimiothèque ne saurait fournir un tel enrichissement. Ainsi, le temps aussi bien que les coûts de l’identification de nouveaux composés peuvent être réduits de façon remarquable. Plus précisément, le recours au criblage in-silico, en préalable à un criblage biologique à plus petite échelle, permet d’ajuster au mieux le nombre de tests expérimentaux ”in-vitro” en fonction des contraintes budgétaires et temporelles. Quand les conditions le permettent, le criblage biologique peut être employé en parallèle au criblage virtuel, afin d’èvaluer l’efficacité de ce dernier et de pouvoir améliorer les paramètres des programmes informatiques utilisés. La pertinence de la molécule employée est la première condition pour le succèes d’un criblage virtuel, bien avant celle des algorithmes utilisés pour la recherche de touches au sein de la molécule. En effet, seule une librairie de composés suffisamment diverse peut garantir une exploration satisfaisante de l’espace chimique, maximisant ainsi les chances de découvrir de nouveaux composés. Par ailleurs, pour éviter de perdre du temps avec des molécules possédant des caractéristiques incompatibles avec celles de composés d’intérêt pharmaceutique, le processus de criblage comporte généralement une étape préliminaire de filtrage. Cette tâche, qui peut être prise en charge par des programmes spécialisés, consiste à exclure les composés toxiques. Ensuite, ne sont retenus que les composés obéissant à des définitions empiriques simples du profil de molécule active. 2.2.3 Les différentes stratégies du criblage virtuel Suivant la nature de l’information expérimentale disponible, on distingue deux approches distinctes pour le criblage virtuel. La première se base sur la structure de la cible, qui est connue sous le nom de ”structure-based virtual screening”, qui rapporte souvent aux algorithmes de docking protéine-ligand. Elle consiste à estimer la complémentarité structurale de chaque molécule criblée avec le site actif considéré. En revanche, ces méthodes sont généralement plus coûteuses en puissance de calcul et leur emploi requiert souvent une expertise plus importante. 6 La seconde, reposant sur la connaissance d’un nombre suffisant d’information concernant une ou plusieurs molécules actives de référence, est appelée ”ligand-based virtual screening”. Cette approche est rapide et relativement simple à mettre en oeuvre, mais son majeur inconvénient est l’interdépendance envers les informations de référence utilisées pour construire le modèle de prédiction d’affinité. Bien que ces deux approches soient surtout utilisées de manière exclusive, leur combinaison lors du criblage permet de maximiser les chances de succès pour identifier de nouvelles touches ”hits”. Dans le cadre de ce travail, nous utilisons l’approche ”structure-based”. 2.2.4 Criblage virtuel à haut débit La simulation de docking moléculaire est une procédé utile pour la prédiction des potentiels interaction des complexes de petite molécule dans des sites de liaison de protéines, ces informations sont indispensables dans la conception de médicaments basée sur la structure (SBDD) ”Structure Based Drug Discovery” [4]. Plusieurs programmes de docking, comme DOCK, GOLD, Autodock, Glide, LigandFit et FlexX, etc se sont montrés utiles dans le pipeline de la découverte in-silico de médicaments. La méthode de base derrière la simulation de docking moléculaire est de générer toutes les conformations possibles d’une molécule de docking et évaluer entre eux l’orientation la plus favorable en tant que mode de liaison de la molécule à l’aide d’une fonction de scoring. Une recherche exhaustive sur toutes les conformations correctes d’un composé est un processus qui consomme beaucoup de temps. Par conséquent, une simulation de docking efficace pour le criblage à grande échelle à haut débit (HTS) consommera de grandes ressources informatiques. Il nécessite quelques Tera-flops par tâche pour effectuer le docking de milliers de composés pour une protéine cible. Cependant, les outils existants manquent de moyen simple pour prévoir des procédures de façon concise pour les utilisateurs régulier afin d’organiser les ressources pour mener un amarrage moléculaires massives. La technologie de la grille commence une nouvelle ère de criblage virtuel en raison de son efficacité ainsi que son rapport coût-efficacité. Le coût des tests in-vitro traditionnelle est généralement très élevé lors du criblage à grande échelle est menée. Le criblage virtuel fournit aux scientifiques un outil efficace pour sélectionner les potentiels composés pour les tests in-vitro. En conséquence, le criblage virtuel à haut débit pourrait bien économiser énorme somme d’argent comparant aux tests in-vitro classique. 2.2.5 Conclusion Nous avons introduit le concept, les stratégies de criblage virtuel. Ce dernier est une approche informatique visant à prédire des propriétés de librairies de molécules. Avec l’essor considérable de données expérimentales publiquement disponibles, cette discipline a enregistré des progrès considérables quant au débit, la qualité et la diversité des prédictions possibles. Un inventaire des applications du criblage ”in-silico” est donné , tout en gardant 7 une attention particulière à des cas concrets d’utilisation ainsi qu’au développements futur. Le criblage virtuel fournit une solution complémentaire pour le criblage virtuel à haut débit ”HTS”, où il comprend des techniques de calcul novatrices. L’avantage du criblage virtuel ”in-silico” est donc de fournir une petite liste de molécules à tester expérimentalement et ainsi réduire les coûts et gagner du temps. On peut aussi explorer rapidement de nombreuses molécules pour se focaliser ensuite, au niveau expérimental, sur les molécules les plus intéressantes. Les difficultés intrinsèques aux techniques à haut débit ainsi que celles rencontrées lors des étapes d’optimisation des molécules chimiques, ont encouragé le développement de nouvelles approches, telles que les techniques de criblage virtuel par docking moléculaire. 8 2.3 2.3.1 Docking Introduction La modélisation de la structure d’un complexe protéine-ligand est très importante pour la compréhension des interactions de liaison entre un composé potentiel ”ligand” et sa cible thérapeutique ”protéine”, et pour la conception de médicaments à base de structure moderne. Le docking ou ”amarrage, arrimage” est une procédé très utile qui vise à prédire l’interaction potentiel de la structure d’un complexe moléculaire à partir des petites molécules dans les sites de liaison de protéine afin d’accélérer la recherche et la découverte de nouveaux médicaments in-silico (c-à-d à l’aide d’ordinateur), ”Le docking in-silico est la détermination de la structure 3D des complexes protéiques à l’échelle atomique, qui permet de mieux comprendre la fonction biologique de ces complexe [1]”. Plus précisement, le docking consiste à trouver la meilleure position d’un ligand (petite molécule) dans le site de liaison d’un récepteur (protéine) de façon à optimiser les interactions avec un récepteur, évaluer les interactions ligand-protéine de façon à pouvoir discriminer entre les positionnement observées expérimentalement et les autres. De façon générale, le docking a pour but de simuler l’interaction entre les molécules in-silico, et les résultats obtenus servent à prédire la structure et les propriétés de nouveaux complexes [3]. Historiquement, les premiers outils de docking obéissaient au principe dit : ”lock-and-key” (principe clef-serrure), selon lequel le ligand qui représente la clef, est complémentaire au niveau géométrique du site actif du récepteur, qui représente la serrure [Yuriev et al., 2011]. Les ligands sont des petites molécules destinées à inhiber l’activité d’une protéine, qui constitue le récepteur. Il permet aussi, de prédire la structure intermoléculaire entre deux molécules en une structure tridimensionnelle 3D, les modes de liaison ou les conformations possibles d’un ligand à un récepteur, et de calculer l’énergie de liaison. La technique de docking prévoit également la résistance de la liaison, l’énergie du complexe, les types de signaux produits et estime l’affinité de liaison entre deux molécules. Elle joue un rôle très important dans l’aide à la décision, afin de déterminer quel ligand candidat interagira le mieux avec un récepteur protéine cible [15]. Le docking protéine-ligand est utilisé pour vérifier la structure, la position et l’orientation d’une protéine quand elle interagit avec les petites molécules comme les ligands. Son but est de prédire et de classer les structures résultant de l’association entre un ligand donné et une protéine cible d’une structure 3D connue. 9 Figure 3 – Docking protéine-ligand Le docking ligand-protéine reste donc la méthode la plus souvent employée, car elle permet une évaluation rapide de bases de milliers, voire de millions de molécules. En principe, un programme de docking doit être capable de générer les modes de liaison attendus pour des ligands dont la position adoptée au sein du site actif est connue dans un temps raisonnable. Pour cela, il est nécessaire que l’algorithme de recherche conformationnelle puisse explorer l’espace conformationnel le plus exhaustivement possible et de façon efficace. Classiquement, on juge la qualité du docking en mesurant le RMSD (Root Mean Square Deviation) sur les atomes entre la pose obtenue en docking, et la pose observée expérimentalement si elle existe. 2.3.2 Approches du docking Les différentes approches du docking se distinguent au niveau de leurs conditions d’application et de la nature des informations qu’elles peuvent fournir. La pertinence du choix d’un programme de docking donné repose en premier lieu sur l’adéquation entre ces caractéristiques et celles du système étudié. L’efficacité de l’algorithme choisi sera par ailleurs un compromis entre la rapidité d’exécution et la précision des résultats. Aussi en fonction du but recherché et du besoin de précision voulu, trois degrés sont en général considérés : rigide (les molécules sont considérées comme rigides), semi-flexible (une molécule rigide et l’autre flexible), flexible (les deux flexibles). Le niveau semi-flexible est souvent appliqué dans le cas protéine-ligand où une des deux molécules (le ligand) de taille moindre est considérée comme flexible et la protéine comme rigide de façon à ne pas trop complexifier le système. 10 Le processus de docking consiste à faire interagir une petite molécule organique avec le récepteur, généralement de nature protéique. La technique de docking comprend 4 étapes principales : 1. Préparer les fichiers pour la protéine. 2. Préparer les fichiers pour le ligand. 3. Préparer les fichiers de paramètres pour la grille. 4. Préparer les fichiers de paramètres pour le docking. Le schéma ci-après montre clairement les étapes de docking. Figure 4 – Étapes du Docking 2.3.3 Principe du docking Le docking moléculaire s’accomplit en deux étapes complémentaires. La première est le Docking, qui consiste à rechercher les conformations du ligand capables à établir des interactions idéales avec le récepteur en utilisant des algorithmes de recherche : algorithme génétique, la méthode de Monte Carlo (qui utilise des procédés aléatoires)... La deuxième dite le ”Scoring”, qui sont des méthodes mathématiques et des fonctions discriminant les poses de docking correctes de celles incorrectes. Ces méthodes sont utilisées pour estimer la puissance d’interaction et l’affinité de liaison et qui permet d’évaluer les conformations par un calcul rapide d’énergie d’interaction des ligands avec un récepteur pour ne retenir que la meilleure. 11 La formule utilisée pour le scoring est la suivante : 4G= 4complexe - 4ligand - 4protéine La figure ci-dessous schématise le principe du docking/scoring, où R symbolise une structure du récepteur. Tandis que, A, B et C représentent les petites molécules. Figure 5 – Illustration de docking/scoring [6] Le docking peut être interprété de manière qualitative par observation de l’entité ligand dans la cavité de la protéine, mais également de manière quantitative par traitement des données provenant des fonctions de scoring. 2.3.4 Outils de Docking A l’heure actuelle, plus de 30 programmes de docking moléculaires (commerciaux ou non) sont disponibles [6]. Les plus fréquemment cités sont respectivement : AutoDock [9], GOLD, FlexX, DOCK et ICM. Ils permettent notamment un criblage rapide de vastes librairies de composés. Ces programmes reposent le plus souvent sur des algorithmes spécifiques (Algorithme génétique, Recuit Simulé...), leur protocole est composé de 2 étapes essentielles Docking/Scoring. Pour accomplir la tâche de docking, les outils d’amarrage moléculaire vont générer une série de poses différentes de liaison au ligand et en utilisant une fonction de notation ”scoring” pour évaluer les affinités de liaison de ligand pour les poses générées afin de déterminer le meilleur mode de liaison. 12

- Xem thêm -

Tài liệu Développement d'un portail web pour le criblage virtuel sur la grille de calcul

Tài liệu liên quan

Tài liệu vừa đăng

Tài liệu xem nhiều nhất