La selección positiva en una oncoproteína bacteriana asociada con el cáncer gástrico
Antecedentes
Helicobacter pylori
es un comensal intestinal de forma vertical heredado que es carcinógeno si posee la isla de patogenicidad cag gratis (cag PAI
); la infección con H. pylori
es el principal factor de riesgo para el cáncer gástrico, la segunda causa principal de muerte por cáncer en todo el mundo (OMS). El cag PAI
locus codifica el gen cagA
, cuya proteína producto se inyecta en las células epiteliales del estómago a través de un sistema de secreción tipo IV, también codificada por el cag PAI
. Una vez allí, la proteína CagA se une a diversas proteínas celulares, lo que resulta en la desregulación de la división celular y la carcinogénesis. Por esta razón, cagA se puede describir como una oncoproteína. Una clara comprensión del mecanismo de acción de cagA y su beneficio para las bacterias es insuficiente.
Resultados
Aquí, revelamos que el cagA
genes pantallas fuertes firmas de selección positiva en bacterias aisladas de las poblaciones amerindias, utilizando la relación Ka /Ks. firmas más débiles se detectan también en el gen de las bacterias aisladas de las poblaciones de Asia, utilizando la relación Ka /Ks y las ramas sitios más sensibles modelo de la PAML paquete. Cuando el cagA
gen aislado de poblaciones amerindias se examinó con más detalle se encontró que la región bajo la selección positiva contiene los dominios EPIYA, que son conocidos para modular la carcinogenicidad del gen. Esto significa que la región de carcinogenicidad modulación del gen está en la adaptación. Los resultados se discuten en relación a la alta incidencia de cáncer de estómago en algunas poblaciones latinoamericanos y asiáticos.
Conclusión
La selección positiva en cagA indica coevolución antagonista entre anfitrión y bacterias, que parece paradójico, dado que cagA es perjudicial para el huésped humano sobre el cual las bacterias depende. Esto sugiere varias posibilidades no excluyentes; que el cáncer gástrico no ha sido una presión selectiva importante en poblaciones humanas, que cagA tiene un beneficio indeterminado para el huésped humano, o que la transmisión horizontal de H.pylori
entre hosts ha sido más importante en la evolución de H. pylori
que previamente reconocido, la reducción de la presión selectiva para reducir la patogenicidad de las bacterias. Los diferentes patrones de adaptación del gen en diferentes poblaciones humanas indican que existen diferencias específicas de población en el medio ambiente intestino humano -. Ya sea debido a las diferencias en la genética del huésped o la dieta y otras características de estilo de vida
Palabras clave
cáncer gástrico oncogén positivo la selección Helicobacter pylori cagA
Introducción
Helicobacter pylori
es una bacteria Gram negativa que vive en el estómago humano como parte del microbioma gástrica normal [1], y generalmente está presente en la mayoría de la población adulta [ ,,,0],2]. La bacteria ha evolucionado conjuntamente con las poblaciones humanas [3] y está bien adaptada y en gran medida específico para el huésped humano. El antepasado de H. pylori fue
intestinal y durante su evolución emigró al estómago, facilitado por la evolución de una ureasa que combate las condiciones ácidas del estómago [4, 5]. H. pylori
cepas pueden poseer una isla de patogenicidad cag gratis (cag PAI
) que contiene un cagA
gen que codifica una proteína de 128 kDa [6, 7]. El cag PAI
parece haber entrado en el genoma de H. pylori
por transferencia lateral de genes, después de H. pylori
diferenciarla de otras especies parentales [2, 8]. Muchos de los genes de la cag
PAI están implicados en la translocación de la proteína cagA en las células epiteliales que revisten el estómago. Sin embargo, la función de la propia proteína cagA es desconocida. La infección por H. pylori cagA +
está fuertemente asociado con el carcinoma gástrico [9-11]; carcinoma gástrico es la segunda causa principal de muerte por cáncer en todo el mundo [12]. Además, cagA
+ H.pylori
está asociado con la gastritis crónica y úlcera péptica [13].
El mecanismo de la patogenicidad de cagA +
H.pylori
es el siguiente . La bacteria se adhiere a la pared del estómago y la proteína CagA se inyecta en una célula epitelial por un sistema de secreción tipo IV bacteriana, también codificada por el cag PAI
locus [14]. Una vez dentro de la célula, cagA es fosforilados en residuos de tirosina ubicados dentro de los dominios EPIYA por miembros de las quinasas src tales como c-Src, Fyn, Yes [15], Lyn [16] y c-Abl [17]. La proteína CagA es asociada a la membrana e interactúa con numerosas proteínas celulares adicionales, incluida la oncoproteína homología Src 2 dominio fosfatasa que contiene tirosina (SHP-2 [18]), microtúbulos afinidad de regulación de la quinasa (MARK2 [19]), factor de crecimiento de unión al receptor proteína 2 (Grb-2 [20]), receptor del factor de crecimiento de hepatocitos (c-Met [21]), C-terminal Src quinasa (Csk [22]) y p38 (Crk [23]). La tirosina fosforilada reclutas cagA y activa SHP-2, aparentemente imitando la acción de Gab1 [24]. Consistente con la hipótesis de la mímica, cagA
es capaz de rescatar Gab1 deficientes Drosophila
mutantes [25], lo cual es interesante ya que cagA
no tiene ninguna similitud con la secuencia Gab1, de hecho, no tiene homólogos conocidos. La interacción con SHP-2 provoca la inhibición de su actividad supresora de tumores [18]. Las células epiteliales que han sido dysregulated adoptan el fenotipo colibrí alargado [26]. Además, cagA activa el factor de transcripción NF-kB conduce a la inducción de la interleucina 8 (IL-8) y la posterior inflamación [27]. La activación de NF-kB se produce a través de SHP-2.
La variación en los dominios de EPIYA cagA da como resultado una modificación de los virulencias de cagA +
diferentes cepas de H. pylori
[28]. Los motivos EPIYA se encuentran en el medio C-terminal de la proteína cagA y son de tipos A-D. Los motivos EPIYA son los principales sitios de fosforilación de la tirosina en la proteína CagA. El motivo EPIYA-D del este, que se encuentra en las poblaciones de Asia, se asocia con fuerte unión a SHP-2, mientras que el motivo EPIYA-C occidental no es. La presencia del motivo EPIYA-D en cagA asiático
secuencias pueden ser responsables de los altos índices de H. pylori
enfermedad asociada en las poblaciones de Asia [28].
El presente estudio investiga la dinámica evolutiva de el gen cagA
de diferentes poblaciones humanas, y muestra que las pantallas de genes cantidades variables de selección positiva, lo que implica la población huésped diferencias genéticas en la respuesta a la infección por H. pylori
, e indicando el beneficio del gen de H. pylori
. La región del gen cagA
virtud de la selección contiene los dominios EPIYA. Estas observaciones son una aparente paradoja, dados los efectos perjudiciales de la oncoproteína en el huésped humano; diversos escenarios se discuten que pueden explicar los datos.
Métodos
secuencias y análisis filogenético
completar cagA
secuencias de diferentes poblaciones humanas se obtuvieron de la base de datos GenBank (NCBI) y se enumeran en la Tabla 1. Aunque aislado de un blanco americano de Tennessee, la secuencia de EE.UU. tiene un origen africano [29], por lo que se denota africano (EE.UU.). Había dos cagA
genes en el genoma del Perú, denotan Perú1 y Peru2. Hay una cagA
adicional gen en el genoma de Venezuela, sin embargo esto es probable que sea un pseudogen debido a una deleción de 119 amino en el extremo N terminal. La busqueda de la base de datos GenBank, y otras especies de Helicobacter
no revelaron un homólogo significativa de cagA. alineaciones de ADN Se construyeron alineando primero las secuencias de proteína, utilizando el programa MAFFT [30], y luego utilizando esta alineación como una plantilla para una alineación de ADN, utilizando el programa PAL2NL [31]. Bayesiano de inferencia filogenética de la cagA
secuencias de ADN se llevó a cabo utilizando el programa MrBayes [32], utilizando un modelo de sustitución de GTR y un parámetro gamma de 0,84, seleccionar mediante el programa de jModelTest [33]. La simulación se realizó durante generaciones 90000, toma de muestras cada 100 generaciones. Una quemadura-en de 25% se llevó a cabo y el árbol de consenso se construyó a partir del último 25% de las secuencias generations.Table 1 cagA
muestra utilizados en el estudio
H. pylori cepa
número de Acceso
Origen
26695
GenBank: NC000915
Reino Unido
J99
GenBank: NC000921 en Africa (EE.UU. )
HPAG1
GenBank: NC008086 en Suecia
Shi470
GenBank: NC010698;
YP001910308 (Perú1), Francia YP001910294 (Peru2)
Perú
G27
GenBank: NC011333 Italia
P12
GenBank: CP001217 Alemania
V225
GenBank: CP001582
Venezuela
VietnamHP-No36
GenBank: FJ798973
Vietnam
MEL-HP27
GenBank: DQ306710 en central de china
F28
GenBank: AB120418
Japón
3K
GenBank: DQ985738 of India
15818
GenBank: AF083352 en Austria
42G
GenBank: FJ389581
de Hong Kong
rRNA secuencias parciales de diversas especies de Helicobacter
fueron obtenidos de GenBank; estos fueron H.fennelliae gratis (GenBank: AF348747), H.acinocychis gratis (GenBank: NR_025940), H. pylori gratis (GenBank: DQ202383), H.nemestrinae gratis (GenBank: AF363064), H.heilmannii gratis (GenBank: AF506794), H.cetorum gratis (GenBank: FN565164), Helicobacter sp. '
Solnick 9A1-T71' (GenBank: AF292381), H.bizzozeronii gratis (GenBank: NR026372), H.salomonis gratis (GenBank: NR026065) y H.felis gratis (GenBank: NR025935) . Las secuencias fueron alineadas utilizando el programa MAFFT y relaciones filogenéticas determinaron utilizando MrBayes y un modelo HKY, seleccionada mediante el programa jModelTest. La simulación se realizó durante generaciones 10000, toma de muestras cada 100 generaciones. Una quemadura-en de 25% se llevó a cabo y el árbol de consenso se construyó a partir del último 25% de las generaciones de la muestra.
Análisis La selección positiva Francia El cagA
secuencias de genes se analizaron para la presencia de la selección positiva por prueba de razón de verosimilitud, comparando modelos anidados, nula y alternativa, utilizando el programa PAML [34]. Se realizaron tres pruebas; la prueba de las ramas [35, 36], los sitios de ensayo [37] y ramificaciones de los sitios de prueba [38]. Se utilizó un árbol sin raíces y sin longitudes de rama para el análisis, generada por el análisis filogenético, y la opción de tabla de frecuencia de codones se utilizó en todos los análisis. prueba de razón de verosimilitud se llevó a cabo para determinar el signficance de 2Δl, las diferencias entre las probabilidades de registro de los dos modelos (donde l es el logaritmo de verosimilitud), utilizando una χ 2 de distribución con 12 grados de libertad para el modelo de ramas, una χ 2 distribución y 2 grados de libertad para el modelo de sitios y χ 2 de distribución con 1 grado de libertad para el modelo ramificaciones de sitios. El modelo nulo utilizado para la prueba ramas era un modelo de una sola relación, donde Ka /Ks (ω) es la misma para todas las ramas, mientras que el modelo alternativo fue el modelo de relación libre donde ω se dejó variar. El modelo nulo para la prueba de los sitios fue modelo de 1a (neutro; Modelo = 0, NSsites = 1, fix_omega = 0), y el modelo alternativo fue el modelo 2a (selección; Modelo = 0, NSsites = 2, fix_omega = 0). El modelo nulo para la prueba de ramificaciones de los sitios se modificó de acuerdo con Yang et al. [39] (neutro; Modelo = 2, NSsites = 2, fix_omega = 1, omega = 1). El modelo alternativo fue el modelo A (modelo de selección; = 2, NSsites = 2, fix_omega = 0).
Resultados y discusión
La selección positiva en cagA México La topología del árbol filogenético de la completa H. pylori
cagA
secuencias reproduce las relaciones entre las diferentes poblaciones humanas de todo el mundo (Figura 1), y es consistente con estudios de mayor escala utilizando secuencias concatenadas que muestran que H. pylori
ha co-migraron con los seres humanos después de su salida de África [3]. La reproducción de la historia evolutiva de las poblaciones humanas en la topología de la cagA
árbol pues es el resultado de la estrecha asociación de H. pylori
con su huésped [3, 40, 41]. El cagA
secuencia obtenida de un individuo indio se encuentra dentro del clado formado por secuencias de Europa, en consonancia con los resultados que muestran que las secuencias de la India cagA
se intercalan con las secuencias de Europa [42] y que la mayor parte de H. pylori
de la India están relacionadas con las cepas europeas [43]. El árbol también indica que el cagA peruana
secuencia ha sido objeto de una reciente duplicación de genes; esto se ve en la estructura operón (Figura 2). fuerte selección positiva en Peru2 indica que neofunctionalization del gen se está produciendo. Es de suponer que los resultados de la duplicación de genes en los efectos de la dosis de genes; cómo afecta esto a la patogenicidad de la cepa en claro. La presencia de un gen cagA
pseudogenized en el genoma de H. pylori
aislado de una amerindia venezolana (ver Métodos) es interesante; la razón de la disparidad entre las suertes de los cagA
genes duplicados en las dos cepas relacionadas también está claro. Las longitudes de las ramas en el árbol filogenético muestran similitud entre sí, con la excepción del linaje vietnamita; esta rama muestra una considerable evolución acelerada. Figura 1 La selección positiva en cagA de diferentes cepas de H. pylori. Un árbol filogenético fue construido consenso como se describe en Métodos que utilizan secuencias cagA
genes completos. Los números por encima y por debajo de las ramas indican los valores de Ka /Ks calculados para cada linaje mediante la prueba de ramas PAML, mientras que los números después de las barras son probabilidades a posteriori de los respectivos nodos. La escala se refiere al número medio de sustituciones por sitio.
Figura 2 Diagrama de la cag PAI de la cepa Perú. Se indica en la figura es la posición de la cagA
de genes duplicados.
2Δl se calculó como 73,6 para la prueba de ramas, que fue estadísticamente significativa. Ka /Ks se observaron valores superiores a 1 para 5 ramas (Figura 1); las que conducen a la (3.10) secuencias de Venezuela (1,56), Perú1 (1.04) y Peru2, al ancestro común de las secuencias de amerindios (1.03) y al linaje que conduce desde el ancestro común de las secuencias de Asia (1.29). Estas ramas son objeto de selección positiva, mientras que el ancestro común amerindian es neutral sobre la longitud del gen.
2Δl se calculó como 161 entre los modelos nula y alternativa, para la prueba de los sitios, que fue estadísticamente significativa. Las estimaciones de los parámetros fueron como sigue: p 0 = 0,51, p 1 = 0,49, ω 0 = 0,03, ω 1 = 1 (modelo neutral), p 0 = 0,47 , p 1 = 0,38, p 3 = 0,14, ω 0 = 0,03, ω 1 = 1, ω 2 = 3,74 (modelo de selección). Sitios identificados como bajo la selección positiva, con significación estadística según la prueba de Bayes empírico Bayes [39], fueron: 101, 206, 306, 378, 532, 542, 548, 604, 651, 774, 793, 815, 831, 834, 869, 876, 886, 892, 901, 998, 1004. la numeración se basa en la secuencia de Perú1.
se realizó una prueba ramificaciones de sitios en cada rama del árbol. Esos linajes encontrados para visualizar la selección positiva se enumeran en la Tabla 2. Estos incluyen los linajes previamente identificados por la prueba de ramas, y, además, los linajes africanos, italianos, suecos y vietnamitas. Los resultados muestran la selección positiva en cagA
aisladas de diversas poblaciones son consistentes con una prueba de McDonald-Kreitman que muestra que
secuencias parciales cagA aisladas de la población mexicana se encuentran bajo selección positiva [44]. no se observa la evolución paralela de residuos o de diferentes regiones de las proteínas cagA, a pesar de residuos en la región amino ácido 900 están bajo fuerte diversificación de la selección, cuando los genes de Venezuela y Peru2 se examinan en un análisis de ventana deslizante (Figura 3). Este es un resultado interesante ya que esta región de la cagA
gen codifica la EPIYA repite, que tiene un papel en la modulación de la carcinogenicidad de la cagA
gen. Por lo tanto, parecería que los efectos de la diversificación de la selección pueden tener un papel directo en la modulación de carcinogenesis.Table 2 Estadística de las ramas sitios análisis de selección positiva
Lineage en el árbol
2⊗ l
residuos prevé que sea bajo
selección positiva (p < 0,05)
Venezuela
48.82
794, 834, 837
Vietnam
288,56
202, 274, 275, 277, 278, 279, 281, 282, 283, 287, 461, 834, 895, 896, 899, 900, 901, 903, 905, 908, 910, 911 , 912, 913, 914, 915, 916, 917, 918, 919, 920, 921, 922 en Suecia
25,6
1008
Perú1
66,2
665, 799, 803
Peru2
3.24
186, 198, 667, 808
linaje ancestral de las cepas amerindias
30
650
linaje ancestral de las cepas asiáticas
21,8
- en Africa (EE.UU.)
11,42
- Italia