In silico
Analyse und Verifikation von S100 Genexpression bei Magenkrebs
Zusammenfassung
Hintergrund
Die Familie S100-Protein besteht aus 22 Mitgliedern, deren Proteinsequenzen umfassen mindestens ein EF-Hand Ca
2 + Bindung Motiv. Sie wurden in der Regulation einer Reihe von zellulären Prozessen wie Zellzyklus und die Differenzierung beteiligt. Allerdings wurde der Expressionsstatus von S100 Familienmitglieder bei Magenkrebs noch nicht bekannt.
Methoden
In Kombination mit der Analyse der Serie Analyse der Genexpression, virtuelle Northern Blot und Microarray-Daten, die Expression von S100 Familienmitglieder im Normal und bösartigen Magengewebe wurden systematisch untersucht. Die Expression von S100A3 wurde durch quantitative RT-PCR untersucht.
Ergebnis einschränken Mindestens 5 S100 Gene wurden in Magen-deutung von in silico Analyse upregulated zu finden. Unter ihnen sind vier Gene, darunter S100A2, S100A4, S100A7 und S100A10, wurden zuvor in Magenkrebs überexprimiert berichtet. Die Expression von S100A3 in achtzig Patienten von Magenkrebs wurde weiter untersucht. Die Ergebnisse zeigten, daß die mittleren Expressionsniveaus von S100A3 in Geweben Magenkrebs 2,5 mal so hoch wie in benachbarten, nicht-tumorösen Gewebe wurden. S100A3 Expression wurde mit Tumor-Differenzierung und TNM korreliert (Tumor-Node-Metastasierung) Stadium von Magenkrebs, die relativ stark exprimiert wurde schlecht differenzierten und fortgeschrittenen Magenkrebsgewebe in (P
< 0,05).
Fazit
dies ist der erste Bericht über die systematische Auswertung von S100 Genexpressionen in Magenkrebs durch mehrere in silico Analyse. Die Ergebnisse zeigten, dass die Überexpression von S100-Genfamilie Mitglieder waren Eigenschaften von Magenkrebs und S100A3 könnte eine wichtige Rolle bei der Differenzierung und Progression von Magenkrebs spielen.
Hintergrund
Magenkrebs ist die zweithäufigste Ursache für Krebstod weltweit. Umwelt- und genetischen Faktoren sind beide wichtig im Magen Karzinogenese [1, 2]. In den letzten zwei Jahrzehnten große Fortschritte bei der Identifizierung von Genen, beteiligt an der Entwicklung von Magenkrebs gemacht worden. Diese identifizierten Gene sind nützlich bei der Pathogenese von Magenkrebs zu verstehen, und die Definition ihrer molekularen Signatur. Sie können auch als Biomarker für die Früherkennung und Ziele für die Arzneimittelentwicklung dienen.
Vor kurzem groß angelegte Genexpressionsanalysen als wichtige Werkzeuge entstanden für Gene Screening im Zusammenhang mit Krebs [3]. Die beiden experimentellen Technologien für eine groß angelegte Genexpressionsanalyse sind: 1) DNA-Sequenzierung-basierte serielle Analyse der Genexpression (SAGE) und ausgedrückt Sequenz-Tag (EST) Ansätze und 2) Dot-Blot-basierten Microarray-Analyse. Mehrere Bioinformatik-Infrastrukturen wurden eingerichtet, Daten aus diesen Techniken abgeleitet zu kompilieren. Unter ihnen ist das Cancer Genome Anatomy Project (CGAP) und Gene Expression Omnibus (GEO) sind zwei wichtige Netzwerke [4, 5]. Vorherige Anwendungen von Data-Mining mit CGAP und GEO-Ressource zur Identifizierung von mehreren neuen oder bekannten krebsbezogenen Genen geführt haben [6, 7].
Die S100-Proteinfamilie 22 Mitglieder, deren Proteinsequenzen umfassen mindestens ein EF-Hand umfasst Ca2 + Bindungsmotiv [8]. S100-Proteine im Zytoplasma und /oder Kern von einer Vielzahl von Zellen lokalisiert, und in der Regulation einer Reihe von zellulären Prozessen wie Zellzyklus und die Differenzierung beteiligt. Siebzehn S100 Familienmitglieder als Cluster auf Chromosom lokalisiert sind 1q21-22, einer Region häufig in mehreren Tumoren neu geordnet. Darüber hinaus hat die molekulare Analyse, dass mehrere S100S enthüllt, darunter S100A2, S100A4, S100A7 und S100A10, zeigen veränderte Expressionsniveaus bei Magenkrebs [9, 10]. So ist es interessant, systematisch die Expression anderer Mitglieder der S100-Familie in normalen und Magenkrebsgewebe zu untersuchen.
In dieser Studie verwendeten wir die Datenbanken und Analyseansätze zur Verfügung von der Gene Expression Omnibus und Cancer Genome Anatomy Project systematisch zu analysieren die Expression von 22 Genen S100 in normalen und Krebs Magen Gewebe. Die unabhängigen SAGE und Microarray-Datensätze wurden für S100 Genexpressionsmuster abgesucht. Wir lieferten Hinweise darauf, dass mindestens fünf S100 Gene bei Magenkrebs nach oben reguliert wurden und weiter experimentell bestätigt die Hochregulation von S100A3 durch quantitative RT-PCR.
Methods
SAGE Analyse
SAGE die Anzahl von Tags Maßnahmen, die die Transkriptions darstellen Produkte eines Gens. Die Daten von SAGE-Technologie ist eine Liste von Tags mit ihren entsprechenden Zählwerte. Alle öffentlich zugänglichen SAGE Daten in GEO-Website bis zum Januar 2008 gesammelt wurden zur Analyse von S100 Genexpression verwendet. Beide NlaIII und Sau3A-Tags aus SAGEmap http:.... //Www ncbi NLM nih gov /SAGE /wurden UniGene Cluster abgebildet http:... //Www ncbi NLM nih . gov /UniGene /. Die zuverlässige UniGene Cluster angepasst S100 Tags wurden angenommen. Diese Sequenz-Tags wurden dann verwendet, um die Niveaus der Expression von 22 Genen S100 in 2 und 8 normale Magenkrebs Bibliotheken zu bestimmen. Eine Liste der Tags für die Analyse verwendet wurde in Tabelle 1 und detaillierte Informationen zu diesen Bibliotheken sind von der GEO-Website zur Verfügung gestellt. Die Analysen wurden durch den Vergleich der durchschnittlichen Anzahl von S100-Tags in Bibliotheken von normaler Schleimhaut mit demjenigen in Bibliotheken von Magenkrebs durchgeführt. Differenz von > 3-fach Änderung wird als positive.Table 1 SAGE Analyse von S100 Gene Expression in normalen und Magenkrebs Bibliotheken
Gene Name betrachtet werden
Unigene Cluster
SAGE Etikett
normal (tpm *)
Krebs (tpm*)
S100A2
516484
GATCTCTTGG
0.0
98.1
S100A3
433168
TCTCCCACAC
0.0
2.8
S100A4
81256
ATGTGTAACG
0.0
207.8
S100A6
275243
CCCCCTGGAT
245.9
865.9
S100A7
112408
GAGCAGCGCC
0.0
143.8
S100A8
416073
TACCTGCAGA
0.0
549.2
S100A9
112405
GTGGCCACGG
0.0
637.0
S100A10
143873
AGCAGATCAG
263.6
1890.5
S100A12
19413
GATTTTTAAA
0.0
13.9
S100A16
515714
AGCAGGAGCA
0.0
130.6
Nur S100S, die Treffer zeigen, sind in dieser Tabelle dargestellt. * Tags pro Million;
Virtuelle Northern
In der CGAP-Datenbank Forscher virtuelle Northern Blot-Analyse ermöglicht die Expression eines bestimmten Gens in allen EST und SAGE Bibliotheken [4] zu sehen. Durch die Gene Finder-Tool http:... //CGAP NCI nih gov /Gene /GeneFinder, einige organisierte Informationen über ein bestimmtes Gen kann durch eine Abfrage entweder die einzigartige Gen-ID oder ein Schlüsselwort gefunden werden. Eingeschlossen in der zur Verfügung stehenden Informationen die EST und SAGE vNorthern expressional Muster über alle verfügbaren Bibliotheken nach ihrem Gewebe Herkunft sind. Die SAGE gesammelten Daten in CGAP umfassen 5 Gewebebibliotheken und 2 Xenotransplantat Bibliotheken von Magenkrebs, sowie 3 normale Bibliotheken des Magens, die sich von der teilweise unterschiedlich waren gesammelt in GEO oben erwähnt. S100 Gene, deren Expression in EST und SAGE-Bibliotheken von Magenkrebs war sowohl > 3, wie viel falten, wie sie im normalen Magen als positive bezeichnet wurden
Microarray-Analyse
Derzeit fünf Mikroarray-Datensätze (Tabelle 2) enthält. Daten von normalen und Magenkrebs Gewebe wurden in GEO Webseite http: //www. ncbi NLM nih gov /projects /Geo /.... Der Datensatz GSE2669, GSE2701 und GSE3438 trugen durch Boussioutas A [11] Chen X [12] und Kim S [13] wurden jeweils für die Durchführung von Mikroarray-Analyse ausgewählt, weil diese drei Datensätze relativ mehr Fälle von normalen und Magenkrebs enthalten (10 Normalen und 64 Krebserkrankungen für Boussioutas A et al; 22 normalen und 90 Krebserkrankungen für Chen X; 50 normalen und 50 Krebserkrankungen für Kim S). Weitere Details zu den Proben und Microarray-Analyse kann von der GEO-Website. Unterschied war signifikant, wenn p
<betrachtet; 0,05. S100 Genen, deren Expression wurde sowohl hoch in drei Gruppen von Magenkrebsgewebe wurden als positive ones.Table 2 Microarray-Datensätze von Magen in Gene Expression gesammelt Krebs Omnibus Website.
Hüllen Array Punkt Lieferant | Normale Krebs | | | GSE2637 3 55 cDNA 13 k /17 K Aggarwal A et al GSE2685 8 22 Oligo- Nukleotid ~ 7.2 K Hippo Y et al GSE2669 10 64 cDNA ~ 7,4 K Boussioutas A et al GSE2701 22 90 cDNA 44 K Chen X et al GSE3438 50 50 cDNA 14 K Kim S et al Gewebeentnahme Achtzig Patienten mit Magenkrebs, die Operation unterzog sich in unser Krankenhaus von September 2004 bis März 2007 wurden in die Studie eingeschlossen. Die resezierten Tumor und benachbarten nicht tumorösen Gewebeproben wurden sofort in flüssigem Stickstoff eingefroren und aufbewahrt bei 70 ° C bis zur RNA-Extraktion. Die Diagnose der beiden Magenkrebs und normale Magenschleimhaut wurde klinisch und pathologisch erwiesen. Das Geschlecht des Patienten, Alter, Tumorgröße, TNM-Stadium, die Tiefe der Wand Invasion, mikroskopische Subtyp, und den Status von Lymphknotenmetastasen wurden aus chirurgischen und pathologischen Aufzeichnungen erhalten. Die Protokolle in dieser Studie verwendet wurden von der Klinik Schutz des Menschen Committee genehmigt. Die Patienten frischen chirurgischen Gewebe für die Studie die Bereitstellung unterzeichnet informierte Zustimmung. Quantitative RT-PCR Gesamt-RNA (mRNA) wurde von Magenkrebs extrahiert und benachbarten nicht-tumorösen Gewebe gemäß den Empfehlungen des Herstellers von Trizolreagenz (Invitrogen, Carlsbad , CA). 1 ug Probe der Gesamt-RNA wurde revers komplementäre DNA (cDNA) mit Oligo (dT) Primern transkribiert. Die Sense- und Antisense-Primer für S100A3 wurden nach der mRNA-Sequenz (GenBank Zugangsnummer NM_002960.1) ausgelegt. Wir verwendeten PCR-Fragmente amplifiziert verschiedenen Exons Spanning Amplifikation von kontaminiertem genomische DNA zu verhindern. Der Sense-Primer war 5'-GACCATCTGGTTCAGGTTCC-3 'und der Antisense-Primer war 5'-ACATTCCCGAAACTCAGTCG-3'. Die PCR-Produkte waren 200 bp groß. Das Housekeeping-Gen GAPDH wurde als interne Kontrolle verwendet. Der Sense-Primer war 5'-CCAGGTGGTCTCCTCTGACTT-3 'und der Antisense-Primer 5'-GTTGCTGTAGCCAAATTCGTTGT-3 wurde ". Die PCR-Produkte waren 130 bp groß. Die Standardkurve erzeugt wurde durch den Kreuzungspunkt jeder Standardmesswert (6-fach seriell verdünnt cDNAs von Herzmuskel, in denen der Gehalt an S100A3 war relativ reichlich) und Plotten sie gegen den logarithmischen Wert der Konzentrationen. Standardkurvenproben wurden in jedem Durchlauf. Quantitative real-time RT-PCR wurde unter Verwendung eines ABI PRISM 7000 Sequenznachweissystem (Applied Biosystems, Foster City, CA) durchgeführt. Die RT-PCR wurde in einem Gesamtvolumen von 30 ul durchgeführt. Das Reaktionsgemisch umfaßte 1 × Puffer, 200 &mgr; mol /l deoxy-Ribonucleosidtriphosphate (dNTPs) (Invitrogen), 0,3 &mgr; mol /L von Sense- und Antisense-Primern, 1 U von Takara ExTaq Hotstart Taq (Takara Biotechnology), 0,6 ul 5 Carboxy-x-Rhodamin (ROX) Referenzfarbstoff, und 2 ul cDNA. Der PCR-Zyklus beteiligt 2 Minuten bei 95 ° C durch 40 Amplifikationszyklen von Denaturierung für 30 Sekunden, Annealing bei 58 ° C (für den Nachweis von GAPDH) oder 55 ° C (für den Nachweis von S100A3) für 30 Sekunden bei 94 ° C gefolgt, und Elongation bei 72 ° C für 1 minute. Die relative Quantifizierung von sowohl S100A3 und GAPDH wurde durch die vergleichende CT (thermischen Zyklus) Methode bestimmt. Die Werte von S100A3 mRNA Expression wurden nach der Expression von GAPDH normalisiert. Jeder Test wurde dreimal wiederholt, um die Ergebnisse zu überprüfen, und das Verhältnis der mRNA-Expressionswert von Magenkrebsgewebe zu benachbarten, nicht-tumorösen Gewebe wurde für die anschließende Analyse verwendet. Die statistische Analyse Zur kontinuierlichen Variablen wurden die Daten ausgedrückt als Mittel +/- SD. Expressionsdaten von S100 Gene in Microarray-Datensätze abgerufen wurde und die Unterschiede in der Expressionsniveaus zwischen normalen und Magenkrebs Gewebe wurden durch Student T-Test bestimmt. Die Assoziation zwischen relativen Expression Verhältnisse von S100A3 und klinischen Eigenschaften wurde von Mann-Whitney-Test analysiert. Alle Daten wurden unter Verwendung des SPSS11.0 Softwarepaket analysiert (SPSS, Chicago, USA), und der Unterschied wurde als signifikant angesehen, wenn p < 0.05. Ergebnisse 1. SAGE und virtuelle Northern Blot-Analyse von S100 Gene Expression in Magenkrebs Es gibt 2 SAGE Bibliotheken der normalen Magenschleimhaut und 8 SAGE Bibliotheken von Magenkrebsgewebe in GEO-Website (GSE545 und GSE14). Diese Bibliotheken wurden von zwei verschiedenen Labors [14, 15]. Die zuverlässigen Tags von 20 S100 Gene wurden aus SAGEmap Webseite extrahiert und verwendet, um die SAGE Daten zu suchen. 3fache Unterschiede (Tabelle 1); 10-Gene wurden stark exprimiert werden, in Magenkrebsgewebe gemäß den Einstellungskriterien >gefunden. In diesen 10 Genen, nur S100A6 und S100A10 konnten in der normalen Magenschleimhaut Gewebe nachweisbar sein, die auch oben durchschnittliche Dichte bei Magenkrebs (865,9 tpm und 1890,5 tpm beziehungsweise) hatte. Die anderen 8-Gene, einschließlich S100A2, S100A3, S100A4, S100A7, S100A8, S100A9, S100A12 und S100A16, hatten unterschiedliche durchschnittliche Dichte im Bereich von 2,8 bis 637,0 tpm tpm, von denen keine in normaler Magenschleimhaut Geweben exprimiert wurden. Kein signifikanter Unterschied in der Expression zwischen normalen und Krebsgewebe auf S100A11, S100A14 und S100P gefunden werden konnte (Daten nicht gezeigt). Wir haben dann virtuelle Northern Blot, der die Expression von Genen, S100 (Tabelle 3) zu analysieren. Sechs Gene wurden bestätigt in Magenkrebsgewebe nach oben reguliert werden. Die positive S100A6, S100A8, S100A16 und durch SAGE-Analyse identifiziert wurden keine signifikanten Unterschiede in der Expression zwischen normalen und Magenkrebs-Bibliotheken haben gezeigt, wenn EST virtuellen Northern Blot durchzuführen. S100A13, nicht nachweisbar in SAGE Bibliotheken, wurde gezeigt, von EST virtuellen Northern Blot in Magenkrebsgewebe stark exprimiert werden. S100A3 und S100A12 konnte nicht durch virtuelle Northern blot.Table 3 Virtuelle Northern Blot-Analyse von S100 Gene Expression in normalen und Magenkrebs Bibliotheken | EST-Tags (tpm *) SAGE-Tags (tpm *) Normal
Cancer
Normal
Cancer
S100A2 0.0 25.9 0.0 200.5 S100A3 0.0 0.0 0.0 0.0 S100A4 52.3 293.7 0.0 168.4 S100A7 0.0 0.0 0.0 304.8 S100A9 0.0 8.6 0.0 1339.4 S100A10 0.0 181.4 272.3 1483.7 S100A12 0 0 0 0 S100A13 0.0 43.2 0.0 0.0 Nur S100S, die Treffer zeigen, sind in dieser Tabelle dargestellt. * Tags pro Million; 2. Microarray-Analyse von S100 Gene Expression in Magenkrebs Microarray-Analyse wurde durchgeführt, um die Überexpression von S100 Gene bei Magenkrebs zu überprüfen. 8, 11 und 7 S100 Gene könnten in GSE2669, GSE2701 und GSE3438 Datensätze (Tabelle 4) gefunden werden. Sowohl S100A2 und S100A10 Gene wurden gezeigt in Magenkrebs aller drei Datensätze nach oben reguliert werden. S100A3 wurde gezeigt, bei Magenkrebs von Daten-Set GSE2669 und GSE2701 überexprimiert wird, die nicht in Dataset GSE3438 bestanden hat. S100A4, S100A6 und S100A7 wurden in nur ein Datensatz in Magenkrebs zu upregulated gezeigt, aber nicht in den anderen beiden Datensätze vorhanden sind. Die Expression von S100A8 und S100A9 hatte keinen signifikanten Unterschied zwischen normalen und kanzerösen Geweben in Datensatzes GSE2701. Die unterschiedliche Expression Tendenz von S100A12 in GSE2701 war im Gegensatz zu der SAGE-Analyse (Tabelle 1) .Tabelle 4 Microarray-Analyse von S100 Gene Expression in normalen und Magenkrebsgewebe | GSE3438 GSE2669 GSE2701 | Normal * Krebs * p Normal * Krebs * p normal * Krebs * P
S100A2 -0.22 0.00 0.00 1.03 1.35 0.01 -0.95 -0.36 0.00 S100A3 # # # 0.84 1.55 0.03 -0.14 0.05 0.03 S100A4 -0.23 0.30 0.00 # # # # # # S100A6 -0.43 0.27 0.00 # # # # # # S100A7 # # # # # # -1.00 -0.35 0.00 S100A8 # # # 0.32 0.69 0.01 0.66 0.70 0.81 S100A9 # # # 1.25 3.48 0.00 0.42 0.79 0.13 S100A10 -0.50 0.42 0.00 0.46 1.36 0.00 0.19 1.22 0.00 S100A12 # # # # # # 0.50 0.21 0.01 Nur S100S, die Treffer zeigen, sind in der Tabelle dargestellt. * Daten aus Microarray-Datensätze extrahiert; # Daten nicht im Datensatz vorhanden sind. Zusammengenommen , 5-Gene wurden nachgewiesen durch alle drei in silico Analyse Ansätze bei Magenkrebs stark exprimiert werden. Sie waren S100A2, S100A3, S100A4, S100A7 und S100A10. Unter diesen 5-Gene war S100A3 die einzige, die zu Magenkrebs noch nicht berichtet wurde zuvor mit Bezug zu werden. Als nächstes werden wir die Expression von S100A3 in Magenkrebsgewebe durch quantitative RT-PCR. 3. Prüfung von S100A3 Überexpression bei Magenkrebs durch quantitative RT-PCR ausgewertet wurde bei Magenkrebs Um zu untersuchen, ob S100A3 überexprimiert, untersuchten wir die mRNA-Expression von S100A3 in Magenkrebsgewebe und entsprechenden benachbarten nicht tumorösen Geweben von 80 Patienten durch quantitative RT-PCR. Das bedeutet relativ Expression von S100A3 in Magenkrebs war 2,52 ± 1,45 im Vergleich zu den benachbarten, nicht-tumorösen Gewebe (p = 0,01). Korrelationen von S100A3 mRNA Ausdrücke mit den klinischen Merkmalen wurden weiter analysiert. Die Ergebnisse zeigten, dass S100A3 mRNA-Expression nicht mit Geschlecht, Alter, Tumorgröße korreliert war, die Tiefe der Wand Invasion, mikroskopische Subtypen oder Lymphknotenmetastasen mit einer Statistik p > 0,05 in jedem Parameter (Tabelle 5). Allerdings fanden wir, dass die Expression von S100A3 mRNA mit Tumor-Differenzierung und Tumor-Node-Metastasierung Stadium korreliert. Die S100A3 Expressionsniveaus in gut und mäßig differenzierten Tumorgewebe waren beide signifikant niedriger als in schlecht differenzierten (p < 0,05). S100A3 Expression in TNM-Stadium I und II war ebenfalls geringer als die in der Stufe III und IV (p = 0,04). Alle diese Daten zeigten, dass S100A3 wurde in Magenkrebs Proben überexprimiert und könnte auf die Differenzierung und Entwicklung von Magen cancer.Table 5 Korrelation von S100A3 mRNA-Expression mit clinicalpathological Parameter bei Patienten mit Magenkarzinom in Beziehung gesetzt werden. Variable mRNA-Expression P | Anzahl N /T > 4 N /T 2-4 N /T 1-2 N /T < 1
| |