de Helicobacter pylori
souches associées à l'ulcération gastrique et le cancer gastrique
Contexte colonisation
persistante du Résumé de l'estomac humain par Helicobacter
pylori est associée à une inflammation asymptomatique gastrique (gastrite) et un risque accru d'ulcère duodénal, ulcère gastrique, cancer gastrique et non cardia. Dans des études précédentes, les séquences du génome de H. pylori
souches provenant de patients souffrant de gastrite ou d'ulcère duodénal ont été analysés. Dans cette étude, nous avons analysé les séquences du génome de la souche d'un H. pylori (98-10) isolé d'un patient ayant un cancer gastrique et un H. pylori
souche (B128) isolées à partir d'un patient atteint de l'ulcère gastrique de. Résultats
Basé sur multilocus sequence typing, la souche 98-10 a été le plus étroitement lié aux souches de H. pylori d'Asie de l'est origine et la souche B128 a été le plus étroitement lié à des souches d'origine européenne. Strain 98-10 contenait plusieurs traits caractéristiques des souches asiatiques, y compris un type S1C vacA
allèle et les allèle d'un cagA codant pour une tyrosine phosphorylation motif Epiya-D. Un génome de base de 1237 gènes était présente dans cinq souches pour lesquelles les séquences du génome sont disponibles. Parmi les gènes de base 1237, un sous-ensemble d'allèles était très divergents dans la souche asiatique 98-10, codant pour des protéines qui ont montré < 90% d'acides aminés d'identité de séquence par rapport aux protéines correspondantes dans les quatre autres souches. gènes spécifiques à la souche uniques ont été identifiés dans chacune des souches nouvellement séquencés, et un ensemble de gènes spécifiques à la souche a été partagée entre les souches de H. pylori associés au cancer gastrique ou des lésions gastriques précancéreuses.
Conclusion
Ces les données permettent de mieux comprendre la diversité qui existe entre les souches de H. pylori d'origines cliniques et géographiques diverses. allèles très divergents et des gènes spécifiques à la souche identifiés dans cette étude peuvent représenter des biomarqueurs utiles pour l'analyse de cloisonnement géographique de H. pylori
et pour identifier des souches capables d'induire des lésions gastriques malignes ou précancéreuses.
Contexte
Helicobacter pylori
est une bactérie en forme de spirale Gram négatif qui colonise constamment l'estomac humain [1]. la colonisation persistante H. pylori de l'estomac humain est un facteur de risque pour plusieurs maladies, y compris l'adénocarcinome non-cardia gastrique, lymphome gastrique et ulcère gastro-duodénal [1, 2]. L'incidence de ces maladies varie considérablement dans le monde entier. Par exemple, l'incidence de l'adénocarcinome gastrique est sensiblement plus élevée en Asie de l'Est, l'Amérique centrale et l'Amérique du Sud que dans la plupart des autres parties du monde [3].
H. pylori
isolats humains indépendants présentent un niveau élevé de diversité génétique [4, 5]. La variation génétique est facilement détectable par une analyse des séquences nucléotidiques des gènes dans différentes souches de H. pylori
[6]. H. pylori de diversité allélique est probablement la conséquence de plusieurs facteurs, y compris un taux élevé de mutation, un taux élevé de intraspécifique de recombinaison génétique, et une longue histoire évolutive de l'espèce [4, 7]. allèles correspondants dans différentes souches de H. pylori
sont généralement 92 à 99% identiques dans les séquences nucléotidiques [4, 6], mais plusieurs H. pylori
gènes présentent un niveau beaucoup plus élevé de diversité génétique [8, 9].
d'autres analyses ont montré qu'il existe une variation géographique parmi les souches de H. pylori [10-16]. Basé sur une analyse de séquence multilocus d'un panel de 370 souches de H. pylori
isolées chez l'homme dans différentes parties du monde, sept populations de souches avec des distributions géographiques distinctes ont été identifiées [17]. Les populations de ces H. pylori reflètent la migration de l'homme de l'Afrique vers d'autres parties du monde au cours d'une période de temps estimée à environ 58.000 années [12]. Les différences géographiques entre H. pylori
souches pourraient être un facteur qui contribue à expliquer l'incidence variable de H. pylori
maladies -Associated dans diverses parties du monde.
En plus de variation entre H. pylori
souches dans les séquences de gènes individuels, il existe des variations considérables entre les souches dans le contenu génétique. Une étude a analysé l'ADN génomique de 56 souches différentes de H. pylori en utilisant des méthodes
tableau d'hybridation et identifié 1150 gènes qui étaient présents dans toutes les souches testées (représentant ainsi un génome «de base») [18]. Parmi les 1531 gènes analysés, 25% étaient absents à partir d'au moins une des souches de 56 H. pylori. Il a été prédit que le génome du noyau de la H. pylori serait composé de 1.111 gènes si un ensemble beaucoup plus vaste d'isolats ont été testés [18]. D'autres études ont rapporté l'existence de génomes de base comprenant 1091 ou 1281 gènes, basée sur l'analyse de la matrice de l'ADN de 34 ou de 15 souches de H. pylori
, respectivement [19, 20]. Une étude a rapporté que la phylogénie des souches de H. pylori basées sur l'analyse MLST était sensiblement différente de la phylogénie de H. pylori
souches basée sur l'analyse du contenu des gènes [18].
Un des plus frappants différences dans le contenu génétique entre les souches de H. pylori est la présence ou l'absence d'une région de 40 kb de l'ADN chromosomique connue comme l'île cag
de pathogénicité (PAI) [8, 21-24]. Aux États-Unis et en Europe, environ 50-60% des souches de H. pylori contiennent le cag
PAI et les souches restantes manquent cette région du chromosome [8, 21-24]. Dans beaucoup d'autres parties du monde, y compris l'Asie orientale, la quasi-totalité H
. Les souches pylori de la cag contiennent
PAI [15, 25, 26]. H. pylori
PAI cag code pour une protéine effectrice, CagA, et un appareil de sécrétion de type IV qui transloque CagA dans les cellules épithéliales gastriques [27]. Les souches de H. pylori hébergeant le cag
PAI sont associés à un risque accru de cancer gastrique non-cardia ou d'une maladie de l'ulcère gastro-duodénal par rapport aux souches qui manquent de l'cag
PAI [21, 28]. La corrélation entre ces maladies et la présence de l'ACG
PAI fournit un exemple de la façon dont les résultats cliniques de l'infection de H. pylori est déterminée en partie par les caractéristiques génétiques des souches avec laquelle une personne est infectée.
Dans des études antérieures, les génomes complets de trois souches
de H. pylori ont été analysées [29-31]. Les souches de ces trois H. pylori ont été isolés chez des patients qui ont eu une gastrite, la gastrite atrophique, ou la maladie de l'ulcère duodénal. Dans l'étude actuelle, nous avons cherché à analyser les caractéristiques génétiques des souches de H. pylori isolées chez des patients avec deux H. pylori
maladies -Associated différentes: l'ulcère gastrique et le cancer gastrique. Pour cette analyse, nous avons sélectionné une souche de l'ulcère gastrique (B128) qui colonise facilement les estomacs des souris et des gerbilles de Mongolie. Cette souche est particulièrement intéressante, car un dérivé animal-repiquées de la souche B128 (souche 7.13) provoque le cancer gastrique dans un modèle de gerbille de Mongolie [32, 33]. Pour une analyse d'un H. pylori associé au cancer
souche gastrique, nous avons choisi la souche 98-10, qui a été isolé à partir d'un patient atteint de cancer gastrique au Japon [34], un pays avec une très forte incidence du cancer gastrique [3 Résultats de, 35].
caractéristiques générales de H. pylori
génomes
Avant l'étude, les séquences génomiques complètes de H. pylori
souches isolées chez les patients atteints de gastrite superficielle, atrophique gastrite, ou maladie de l'ulcère duodénal ont été rapportés [29-31]. Dans la présente étude, nous avons analysé les séquences du génome de la souche d'Helicobacter pylori (98-10) qui a été isolé à partir d'un patient atteint d'un cancer gastrique [34] et une souche (B128), qui a été isolé d'un patient avec gastrique maladie de l'ulcère [32]. Caractéristiques générales des deux génomes analysés dans la présente étude, par comparaison avec trois génomes déjà séquencés sont résumés dans le tableau 1. Pour identifier les éléments génétiques transposables qui pourraient être présents dans les deux génomes nouvellement séquencés, les séquences de nucleotides de chaque génome ont été utilisées comme interrogations pour rechercher une base de données de séquence http d'insertion:.. //www-est biotoul fr. Strain 98-10 contenait ORFs (HP9810_5g1 et HP9810_5g2) homologues à ORFs trouvés dans IS607 (numéro d'accession AF189015) [36]. Strain B128 contenait ORFs (HPB128_26g16, HPB128_26g17 et HPB128_26g18) homologues à ORFs trouvés dans ISHp608 (numéro d'accession AF357224), mais insertions nucléotidiques sont prédits pour perturber le gène de la transposase dans la souche B128 [37]. IS607 et ISHp608 ne sont pas présentes dans l'une des trois souches de H. pylori
pour lesquelles les séquences du génome sont disponibles auparavant. Une étude antérieure a indiqué que IS607 a été détecté dans environ 20% des souches de H. pylori [36]. ISHp608 est non aléatoire distribué géographiquement parmi les souches de H. pylori, et cet élément a été signalé à être plus abondante dans les souches provenant de patients atteints de cancer gastrique péruviens que dans les souches provenant de patients souffrant de gastrite péruviennes seulement [37] .table 1 Caractéristiques de H. pylori de génomes
H. pylori souche | 26695 J99 HPAG1 98-10 B128 Origin UK US Suède Japon US Gastrite maladie statea seulement dU AG GC GU cag PAI Oui Oui Oui Oui Oui vacA de génotype S1a /m1 S1b /m1 S1b /m1 S1C /m1 S1a /m2h taille du génome (Mb) total de 1,67 1,64 1.61b 1.6c 1.6c pas. de ORFs 1564d 1491e 1544f 1527 1731 No. de genesg spécifique de la souche 69 23 38 22 51 un DU, ulcère duodénal; AG, gastrite atrophique; GC, cancer de l'estomac; GU, ulcère gastrique b Comprend un plasmide de 9,3 kb. C La taille du génome de la souche 98-10 est basée sur l'analyse de 51 grands contigs, tel que défini dans les méthodes. La taille du génome de la souche B128 est basée sur l'analyse de 73 grands contigs. D L'analyse actuelle est basée sur des données téléchargées à partir de TIGR, comprenant 1564 ORFs. En revanche, une table sur le site TIGR listes 1587 CLO dans la souche 26695, et les fichiers de séquence Genbank comprennent 1566 ORFs de la souche 26695. e ORFs supplémentaires, non compris dans ce total, ont ensuite été détectée dans la souche J99 [43]. f le chromosome HPAG1 contient 1536 gènes prédits codant pour des protéines, et le reste sont contenues sur un plasmide. g présent dans un seul des cinq souches analysées dans cette étude. h vacA est tronquée dans la souche B128. analyse MLST des souches de H. pylori dans des études précédentes, l'analyse MLST a été utilisé pour classer H. pylori isolats en plusieurs haplogroupes qui ont des distributions géographiques distinctes [17]. Pour affecter les deux nouvelles séquences H. pylori souches à l'un des groupes de population décrits précédemment, nous avons comparé huit séquences de gènes provenant de chaque souche aux séquences correspondantes de 434 autres H. pylori isolats, en utilisant une base de données MLST comme décrit dans les méthodes. Sur la base de cette analyse, la souche 98-10 a été classée en tant que membre du groupe de la population et de la souche B128 Asie de l'Est a été classé comme un membre du groupe de la population européenne. Un arbre neighbour-joining représentant les relations des deux souches nouvellement séquencées pour les souches de référence représentatives isolées à partir de divers emplacements géographiques est représenté sur la figure 1. Le groupement représenté sur cet arbre neighbour-joining reflète avec précision l'origine géographique des souches de référence, et est accord avec les affectations antérieures des souches de référence à des groupes de population distincts [18]. En accord avec un précédent rapport [17], l'un des séquencées précédemment H. pylori souches (J99) a été le plus étroitement lié à des souches isolées en Afrique de l'Ouest, et un autre (26695) a été le plus étroitement lié à des souches isolées en Europe . la souche Une troisième H. pylori (de HPAG1) analysé dans une étude préalable a été étroitement liée à des souches isolées en Europe. La figure 1 illustre que la souche 98-10 est le plus étroitement lié à des souches d'origine asiatique, et par conséquent, la souche 98-10 appartient à un groupe de population différentes de celles des souches pour lesquelles séquences génomiques ont déjà été signalés. Collectivement, les séquences génomiques disponibles pour l'analyse représentent trois principales populations géographiques de H. pylori souches [européenne (26695, HPAG1 et B128), Afrique de l'Ouest (J99) et Asie de l'Est (98-10)]. Figure 1 Structure phylogénétique basée sur l'analyse de la séquence de 8 H. pylori gènes de base. Les souches de H. pylori analysés dans cette figure comprennent les souches 98-10, B128, trois souches pour lesquelles séquences génomiques ont été préalablement déterminées (26695, J99, HPAG1), et des souches représentatives isolées à partir de patients dans divers lieux géographiques [18]. La figure énumère les désignations de souche et les pays où les souches ont été isolées. Les séquences de nucleotides des locus MLST concaténé ont été alignées et comparées, comme décrit dans les Méthodes. Toutes les positions contenant les lacunes et les données manquantes ont été éliminés de l'ensemble de données. Il y avait un total de 3041 postes dans l'ensemble de données final. arbres neighbor-joining ont été construits sur la base des distances estimées par le modèle à 2 paramètres Kimura de nucleotide substitution [57, 58]. L'arbre de consensus bootstrap inférée à partir de 1000 réplicats est pris pour représenter l'histoire de l'évolution des souches analysées [59]. Branches correspondant aux partitions reproduites dans moins de 50% réplicats bootstrap sont effondrés. L'arbre est dessiné à l'échelle, avec les longueurs de branches dans les mêmes unités que celles des distances évolutives utilisées pour inférer l'arbre phylogénétique. Les analyses phylogénétiques ont été menées en MEGA4 [63]. Cinq souches H. pylori pour lequel les séquences du génome étaient disponibles sont désignés par les diamants. Trois principales H. pylori groupes de population (Asie de l'Est, Europe et Afrique de l'Ouest) sont identifiables de. Analyse des cagA et de CagA et VacA de vacA sont deux importants H. pylori facteurs de virulence qui sont sécrétées par une voie de sécrétion de type IV et de type V (autotransporteur) voie de sécrétion, respectivement [14, 38]. La diversité dans cagA et les gènes vacA de a été étudiée en détail dans les études précédentes, et la diversité dans ces gènes fournit une base pour le typage des souches de H. pylori [8, 13-15]. Par conséquent, nous avons analysé la cagA et les gènes vacA de chacune des deux souches nouvellement séquencées. Lorsque la souche 98-10 a été mis en incubation avec les cellules épithéliales gastriques AGS comme décrit précédemment [39], CagA a subi la phosphorylation sur tyrosine (données non présentées), ce qui indique que cette souche présente un système de sécrétion de type IV fonctionnels pour la translocation de CagA dans des cellules hôtes [27]. La protéine codée par la souche CagA 98-10 contient 3 motifs Epiya (sites de phosphorylation de la tyrosine), qui ont été désignés Epiya-A-Epiya B et D Epiya [14]. La présence d'un motif Epiya-D est caractéristique des souches de H. pylori isolées en Asie de l'Est [13, 14]. Bouillon surnageant de culture de la souche 98-10 a provoqué une vacuolisation des cellules HeLa, ce qui indique la présence d'une toxine VacA active. Cette souche contient un S1C de type /m1 vacA allèle, une caractéristique qui est caractéristique des souches de H. pylori isolées en Asie de l'Est [15, 40]. Identification de l'Asie orientale cagA et vacA de les motifs de la souche 98-10 est compatible avec les résultats de l'analyse MLST, qui a classé la souche 98-10 en tant que membre du groupe de la population asiatique de H. pylori souches. similaire à la souche 98-10, la souche B128 dispose d'un système de sécrétion de type IV fonctionnel qui peut translocation CagA dans les cellules épithéliales gastriques et CagA subit ensuite la phosphorylation sur tyrosine [41]. La protéine codée par CagA souche B128 contient deux motifs Epiya, désignés Epiya-A et Epiya-C [14]. La souche B128 contient un type s1 /l'allèle m2 vacA, mais la mutation d'un vacA dans cette souche est prévu pour empêcher l'expression d'une pleine longueur de protéine VacA. La présence de cette dernière mutation a été confirmée par analyse de la séquence nucléotidique du fragment d'un vacA amplifié par PCR. Analyse par immunotransfert en utilisant plusieurs antiserums anti VacA a indiqué que cette souche ne produit pas une protéine VacA détectable, et un bouillon de culture surnageant de cette souche n'a pas provoqué une vacuolisation de cellules HeLa (données non montrées). Caractérisation de la bactérie H. pylori core génome Délimitation du génome de base d'un H. pylori (c.-à-gènes qui sont toujours présents dans tous H. pylori isolats) est d'intérêt, parce que beaucoup de ces gènes sont susceptibles d'être requis pour la colonisation de l'estomac humain. Basé sur l'utilisation de score BLAST analyse du rapport tel que décrit dans les méthodes, nous avons identifié 1237 gènes qui étaient présents dans l'ensemble des 5 génomes H. pylori (Figure 2 et de fichiers supplémentaires 1). Dans une précédente étude, 56 souches H. pylori différents ont été analysés par la méthode de la matrice, et un génome de base de 1150 gènes a été signalé à être présents dans les 56 souches [18]. Parmi les 1150 gènes signalés à comprendre le génome de base de la H. pylori basée sur l'analyse de réseau, 1094 étaient présents dans les 5 souches analysées dans l'étude actuelle, telle que déterminée par analyse de séquence. La liste de gènes essentiels détectés dans chacun des cinq souches par analyse de la séquence, mais pas par l'analyse de réseau comprend > 20 gènes situés à l'intérieur du PAI cag . Bien que le cag PAI est présent dans toutes les 5 souches analysées dans l'étude actuelle, cette région de l'ADN est connu pour être absent de nombreux H. pylori souches [24]. Cinq autres groupes de gènes contigus (chacune avec au moins 4 gènes par grappe) étaient présents dans les 5 souches séquencées, mais étaient absents de la liste des gènes de base identifiés par analyse de réseau (HP0061-0065, HP0797-0800, HP1339-1343, HP1400-1403 et HP1455-1458) (fichier supplémentaire 1). Les différences de désignation des gènes de base dans l'étude actuelle par rapport aux études précédentes peuvent être attribués à de nombreux facteurs, y compris des différences dans le nombre de souches analysées et des différences de méthodologie pour la détection du gène. Figure 2: Comparaison des protéomes prédits par rapport BLAST-score (BSR) analyse. Le panneau de gauche montre une analyse de BSR des protéines codées par la souche J99 et HPAG1, avec la souche 26695 comme souche de référence. Le panneau de droite montre une analyse de BSR des protéines codées par la souche 98-10 et B128, avec la souche 26695 comme souche de référence. L'approche BSR analyse toutes les protéines prédites à coder par trois génomes, en utilisant une mesure de similarité basée sur le rapport entre les scores de BLAST, tel que décrit dans les Méthodes. Les protéines décrites dans la boîte dans le coin inférieur gauche (BSR < 0,4) correspondent à des protéines présentes dans le protéome de référence (souche 26695), mais absentes des deux protéomes de requête. Le quadrant supérieur droit représente les protéines conservées dans les trois protéomes. Une analyse des 1237 gènes de base ont indiqué que, dans presque tous les cas, il y avait des différences dans les séquences d'acides aminés des protéines codées par des souches individuelles. Des comparaisons par paires de protéines codées par les différentes souches ont indiqué que les niveaux de connexité se situaient entre 65% et une identité d'acides aminés de 100%. Une comparaison représentative des protéines de nucléocapside codées par les deux souches (et 98-10 26695) est représentée sur la figure 3. Seuls les 11 gènes ont été identifiés pour lesquels les séquences d'acides aminés des protéines codées sont identiques entre toutes les 5 souches. Sept de ces 11 gènes codés protéines ribosomales; d'autres encodées un facteur d'initiation de traduction (IF-1), une lipoprotéine (Lpp20), une protéine flagellaire de base de corps (Flie), et une protéine de fonction inconnue (HP0031). Figure 3 Relatedness des protéines essentielles prévues à coder par H. pylori souches 98-10 et 26695. Un ensemble de 1237 gènes présents dans les 5 H. pylori souches a été identifié, comme décrit dans les méthodes. Les séquences déduites d'acides aminés des protéines correspondantes codées par la souche 98-10 ont été utilisés pour rechercher une base de données de séquences à partir de la souche 26695 en utilisant FastA. La meilleure correspondance a été identifiée et l'identité des acides aminés pour cent a été calculée. L'histogramme montre le nombre de ORFs présentant le niveau indiqué d'identité d'acides aminés de. L'analyse des gènes divergents dans un H. associé au cancer asiatique souche pylori H. pylori souches isolées à partir sans rapport les humains présentent la diversité allélique (typiquement 92-99% nucléotide d'identité parmi les allèles correspondants), qui fournit une base pour la classification des souches en grappes de population via l'analyse MLST. Plusieurs gènes présentent un niveau sensiblement plus élevé de diversité allélique. Par exemple, au moins deux gènes (cagA et SEL1 homologue) sont connus pour être nettement divergentes en Asie de l'Est H. pylori souches par rapport à H. pylori occidentaux souches [13, 14 , 42]. Nous émettons l'hypothèse que les gènes supplémentaires peuvent être très divergents dans la souche asiatique 98-10 par rapport aux 4 autres souches séquencées. Pour identifier les produits de gènes codés par le génome de 98-10 qui sont nettement divergentes par rapport aux produits codés par les 4 autres génomes, nous nous sommes concentrés sur l'analyse des 1237 gènes de base qui étaient présents dans les 5 souches séquencées. En utilisant l'approche décrite dans les méthodes, nous avons identifié 8 produits de gènes qui étaient très divergents dans la souche asiatique par rapport aux quatre autres souches (tableau 2). Ceux-ci comprennent CagA et un sel1 homologue, qui ont été précédemment rapporté pour être nettement divergentes dans les souches asiatiques par rapport aux souches provenant d'autres parties du monde [13, 42]. Les séquences d'acides aminés de ces protéines divergentes codées par la souche japonaise 98-10 ont chacun < 90% identiques à des séquences de protéines correspondant aux quatre autres souches (tableau 2). Dans chaque cas, les allèles divergentes dans la souche 98-10 et allèles correspondants dans les quatre autres souches ont été flanqués par le même chromosomique genes.Table 2 allèles très divergents dans la souche asiatique 98-10 numéro de Gene (98-10) numéro de Gene (26695) description % aa d'identité (98 -10) a identité aa% (non-98-10) b % des sites uniques c
HP9810_903g20 HP0061d Hypothetical 67 86 21 HP9810_889g5 HP0492d hpaA 72 homologue 92 21 HP9810_889g32 HP0519d sel1 73 92 15 HP9810_905g13 HP0547 de homologue cagA 79 87 11 HP9810_868g41 HP0806d Hypothetical 86 92 6 HP9810_899g75 HP1322d Hypothetical 75 90 18 HP9810_899g76 HP1323d Ribonuclease 88 92 6 HP9810_885g15 HP1524d Hypothetical 80 95 13 a Les séquences des produits de gènes indiqués dans la souche 98-10 ont été comparées aux séquences correspondantes dans chacune des 4 autres souches (26695, J99, HPAG1 et B128), et moyenne% d'acides identités d'acides ont été calculées comme décrit dans les méthodes. b les séquences des produits de gènes indiqués dans chaque souche ont été comparés dans toutes les permutations, sauf que les comparaisons impliquant la souche 98-10 ont été exclus de l'analyse. Moyenne% d'acides aminés identités ont été calculées comme décrit dans les méthodes. Le plus cPercentage des sites alignés dans lequel la protéine provenant de la souche 98-10 contenait un acide aminé différent des acides aminés correspondants dans les protéines de 4 autres souches. À dReported être un constituant du pylori génome central H., à base d'au moins une analyse de la matrice [18-20]. Comme le montre la figure 1, la souche J99 est plus étroitement liée à H. pylori souches isolé en Afrique de l'Ouest, un groupe de population différente de celle des autres souches pour lesquelles les séquences du génome sont disponibles. Par conséquent, nous avons supposé que les gènes spécifiques pourraient être très divergents dans la souche J99 Afrique de l'Ouest par rapport aux 4 autres souches séquencées. Pour identifier ces gènes, nous avons utilisé la même approche que décrit ci-dessus. Quatre allèles très divergentes uniques ont été identifiés dans la souche J99 (tableau 3), chacun des produits de codage qui ont été < 90% identiques à celles des protéines correspondantes dans les quatre autres souches. allèles très divergentes uniques ne sont pas facilement identifiables dans les souches 26695, HPAG1 ou B128. Une exception notable a été l'identification d'un vacA très divergentes de l'allèle dans la souche B128 (HPB128_147g10 génique). Identification de vacA comme un allèle divergent dans la souche B128 est attribuable à la présence d'un s1 /m2 vacA de l'allèle dans cette souche et la présence d'allèles m1 /s1 dans les quatre autres souches; m1 et m2 formes de VacA présentent généralement que l'identité d'acides aminés 60-70% dans la région centrale de la protéine [38] .table 3 allèles très divergents dans la souche J99 numéro de Gene (J99) numéro de Gene (26695) description % aa identité (J99) a identité% aa (non-J99) b % des sites uniques c
jhp0028 HP0032 Hypothetical 68 91 24 jhp0080 HP0087d Hypothetical 89 96 8 jhp0173 HP0185d Hypothetical 88 93 7 jhp0395 HP1029d Hypothetical 88 95 7 a Les séquences des produits de gènes indiqués dans la souche J99 ont été comparées aux séquences correspondantes dans chacune des 4 autres souches (26695, HPAG1, B128, et 98-10), et la moyenne% d'acides aminés identités ont été calculées. La b séquences des produits de gènes indiqués dans chaque souche ont été comparés dans toutes les permutations, sauf que les comparaisons impliquant la souche J99 ont été exclus de l'analyse. Moyenne% d'acides aminés identités ont été calculées. Le plus cPercentage des sites alignés dans lequel la protéine provenant de la souche J99 contenait un acide aminé différent des acides aminés correspondants de protéines à partir de 4 autres souches. D Signalé être un constituant du H. pylori de base du génome, à base d'au moins une analyse de réseau [18-20] identification de nouveaux gènes spécifiques de la souche de. Pour identifier les gènes spécifiques à la souche unique présents dans l'une des deux nouvelles séquences génomes séquencés, mais pas auparavant H. pylori génomes, nous avons de nouveau utilisé une analyse de ratio de score BLAST, tel que décrit dans les Méthodes (Figure 2). Strain 98-10 contenait 22 nouveaux gènes spécifiques à la souche et la souche B128 contenait 51 (fichiers supplémentaires 2 et 3). En outre, nous avons identifié 16 gènes qui étaient présents dans les deux souche 98-10 et B128, mais pas présent dans aucune des souches déjà séquencés (fichier complémentaire 4). Plusieurs des ORFs spécifiques à la souche de H. pylori souches 98-10 et B128 ont été < 100 nucléotides de longueur, et on ne sait pas si oui ou non ces très courtes ORFs sont réellement traduits en protéines. Une analyse de gènes spécifiques de souches uniques dans les trois précédemment séquencé les génomes de H. pylori (26695, J99 et HPAG1) a révélé un nombre similaire de gènes spécifiques à la souche uniques (tableau 1), qui ont été décrites dans des études antérieures [ ,,,0],29-31]. pour identifier les fonctions possibles des gènes spécifiques à la souche trouvée uniquement dans la souche 98-10 ou B128 (ou les deux 98-10 et B128), les séquences protéiques déduites ont été utilisés comme des requêtes pour la recherche d'un BLAST la base de données NCBI des séquences protéiques non redondantes (voir le tableau 4 et les fichiers complémentaires 2, 3, 4). La plupart des protéines spécifiques à la souche trouvée uniquement dans la souche 98-10 ou B128 ont pas été étroitement liée à des protéines connues ou étaient liés à des protéines dans la base de données dont les fonctions ne sont pas connus. Plusieurs des gènes spécifiques à la souche trouvée exclusivement dans la souche 98-10 ou B128 ont été précédemment détectés dans des souches de H. pylori pour lesquels les séquences génomiques ne sont pas déterminées. Comme cela est décrit ci-dessus, des séquences d'insertion et des gènes codant pour une transposase (IS607 et ISHp608) ont été identifiés. Deux gènes spécifiques de la souche de Helicobacter pylori de la souche B128 (HPB128_11g15 et HPB128_11g23) des protéines codées relatives au type IV, les composants du système de sécrétion (VirB9 et VirD4, respectivement). Les gènes de ce groupe (couvrant HPB128_11g15 à HPB128_11g23) ne sont pas détectés dans les analyses génomiques d'origine des souches J99, 26695, ou HPAG1 [29-31], mais ont ensuite été détectés dans la souche J99 et plusieurs autres H. pylori souches les gènes de H. pylori [43] .Table 4 Strain spécifiques présents exclusivement dans la souche 98-10 ou B128 | Nombre de gènes la souche (s) indiqué un | 98-10 B128 98-10 et B128 nombre total de la souche 22 51 16 classe fonctionnelle de Genesa spécifique de transposase 2 3 6 type IV gène de sécrétion 0 cluster B 7 0 hypothétique 17 37 9 Aucun match de base de données 8 8 2 le plus proche correspondance manque de fonction connue 9 29 7 Autres 3 4 1 îles de gènes contenant genesc spécifique de la souche 2 11 3 aPresent dans la souche (s) indiqué, mais pas dans l'un des quatre autres souches pour lesquelles les séquences du génome sont disponibles. groupe bLe de gènes n'a pas été détectés dans l'analyse originale du génome de la souche J99, mais a ensuite été détectée dans la souche J99 [43]. cPour cette analyse, une île a été considéré comme présent si deux ou plusieurs gènes spécifiques à la souche étaient contiguës loci chromosomiques. intéressant, la souche B128 contient plusieurs gènes (HPB128_155g19, HPB128_156g11 , HPB128_156g12, HPB128_184g1, HPB128_190g1) prédit pour coder des protéines qui sont plus étroitement liées aux protéines codées par H. acinonychis (espèces d'un Helicobacter isolés de grands chats) [44] ou H. cetorum (a http://www.softberry.com/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindb[56],
|