Stomach Health > Magen Gesundheit >  > Stomach Knowledges > Magen-Artikel

PLoS ONE: Serum Apolipoproteins CI und C-III in Magen-Krebs-Patienten zu reduzieren: Ergebnisse von MALDI-Based Peptidoms und Immuno-Based Clinical Assays

Abstrakt

Die Suche nach neuen Peptid-Biomarker für Magenkrebs in der menschlichen Seren, die Überwachung von Magenkrebs kann in eine klinisch praktikabel Prognoseverfahren implementiert werden. Wir untersuchten die Serum Peptidoms aus zwei verschiedenen biorepositories. Wir verwendeten zunächst einen C8-Umkehrphasen-Flüssigchromatographie Ansatz für die Probenaufbereitung, gefolgt von massenspektrometrischen Analyse. Diese wurden auf Serumproben von Krebsfrei angewendet Kontrollen und Magenkrebs-Patienten in verschiedenen klinischen Phasen. Wir haben dann eine bioinformatische Analyse-Pipeline und identifizierte Peptid Signatur Patienten Unterscheidung Magen-Adenokarzinom von Krebs-freie Kontrollen. Matrix-assistierte Laser-Desorptions /Ionisations-Flugzeit (MALDI-TOF) ergibt sich aus 103 Proben ergab 9 Signaturpeptide; mit Vorhersagegenauigkeit von 89% in der Trainingsmenge und 88% in der Validierungssatz. Drei der Scheidungs ​​Peptide entdeckt wurden Fragmente von Apolipoproteine ​​C-I und C-III (apoC-I und C-III); quantifizierten wir weiter ihre Serumspiegel sowie CA19-9 und CRP, in 142 Proben quantitative kommerziellen klinischen Assays verwendet. ApoC-I und apoC-III quantitative Ergebnisse mit den MS-Ergebnisse korreliert. Wir haben dann apoB-100-normalisierte apoC-I und apoC-III eingesetzt, CA19-9 und CRP-Spiegel Regeln für Magenkrebs Vorhersage gesetzt zu erzeugen. Für die Ausbildung, haben wir Seren von einem Repository, und für die Validierung, haben wir Seren aus dem zweiten Repository. Prediction Genauigkeiten von 88,4% und 74,4% wurden in den Probe- und Validierungssätze erhalten wurden. Die Serumspiegel von apoC-I und apoC-III in Kombination mit anderen klinischen Parametern können für die Formulierung eines diagnostischen Score für Magenkrebs-Patienten als Grundlage dienen

Citation. Cohen M, Yossef R, Erez T, Kugel A, Welt M, Karpasas MM, et al. (2011) Serum Apolipoproteine ​​C-I und C-III in Magen-Krebs-Patienten zu reduzieren: Ergebnisse von MALDI-Based Peptidoms und Immuno-Based Clinical Assays. PLoS ONE 6 (1): e14540. doi: 10.1371 /journal.pone.0014540

Editor: Hana Algül, Technische Universität München, Deutschland |

Empfangen: 1. Juli 2010; Akzeptiert: 22. November 2010; Veröffentlicht am: 18. Januar 2011

© 2011 Cohen et al. Dies ist eine Open-Access-Artikel unter den Bedingungen der Lizenz Creative Commons, die uneingeschränkte Nutzung erlaubt, die Verteilung und Vervielfältigung in jedem Medium, das Autor und Quelle zur Verfügung gestellt werden gutgeschrieben

Finanzierung:. Die Finanzierung war von der Europäischen Gemeinschaft (RP6 GLYFDIS 037661) zur Verfügung gestellt. RNTech SAS Frankreich als Funder erklärt aufgrund der Tatsache, dass JT und HB sind /Mitarbeiter dieses Unternehmens waren; die Beiträge von JT und HB sind definiert als endgültige Genehmigung der Version veröffentlicht werden, und sie wurden in Beitrag zur Konzeption und Gestaltung, oder die Erfassung von Daten, oder die Analyse und Interpretation von Daten oder die Erstellung des Manuskriptes nicht beteiligt. Die Geldgeber hatten keine Rolle in Studiendesign, Datenerfassung und Analyse, Entscheidung oder Vorbereitung des Manuskripts zur Veröffentlichung

Konkurrierende Interessen:. Die Tatsache, dass zwei ehemalige oder aktuelle Mitarbeiter von RNTech SAS Frankreich Autoren dieses Manuskripts sind nicht die Einhaltung aller der PLoS ONE Politik auf den Austausch von Daten und Materialien zu verändern, wie in der Online-Leitfaden für Autoren beschrieben.

Einführung

die Mortalitätsraten von vielen Krebsarten haben nicht dramatisch in die geändert letzten 20 Jahren [1]. wurde die Früherkennung, die Wirksamkeit der Krebsbehandlung, noch Detektions oft nur möglich nach dem Auftreten der ersten klinischen Symptome, die in einigen Krebsarten für eine erfolgreiche Intervention erfolgt zu spät, um erheblich verbessern gezeigt. Dies ist vor allem auf das Fehlen von spezifischen und sensitiven Tests, die Früherkennung und Überwachung von Krebszuständen ermöglichen. Deshalb ist die Entdeckung neuer Tumor Biomarkern zunehmend kritisch betrachtet Krebsbehandlung zu verbessern. In den letzten zehn Jahren haben sich auf die Entdeckung von Biomarkern viele Studien konzentriert. Einer der vielversprechendsten Quellen für die Entdeckung neuer Biomarker ist das menschliche Blut, insbesondere Serum und Plasma, die viele Ereignisse im Körper, in Echtzeit reflektieren kann. Doch trotz immense Bemühungen, nur eine sehr kleine Anzahl von Plasmaproteinen nachgewiesen worden diagnostischen Wert haben [2] - [5]. Häufig diese Biomarker stehen nicht allein und werden durch andere Tests zur Überwachung und Diagnose begleitet. Die meisten von ihnen sind nicht spezifisch und empfindlich genug für Breitbild-Diagnose [6], [7].

Eine mögliche Quelle für neuartige Krebs Biomarker ist die Peptidoms. Die Logik hinter Fokussierung auf die Serum-Peptide auf Beweise aus, dass Krebsentstehung und Entwicklung Änderung in Proteine ​​beinhaltet die gesamte Peptidoms 'und Peptide Stoffwechsel und auf die erhöhte Verfügbarkeit der Methodik für das Screening. Im Hinblick auf die Entwicklung von Krebs, auftreten können Änderungen in der Anordnung von intra- und extrazellulären Peptide im Blut Peptidoms dargestellt, die zur Krebsstadium spezifisch sein können und somit ein diagnostisches Potential haben, [2], [4], [ ,,,0],5]. In Bezug auf die Detektionstechnologie ermöglichen die jüngsten Fortschritte in MS-Technologie die Detektion von Hunderten von Peptiden, die von einigen Mikroliter Serum [8], [9]. Tatsächlich eine Reihe von Signaturpeptide in Serum früheren Studien Blut Peptidoms berichtet, die von Krebspatienten (beschrieben in [5]) gesund ausgezeichnet hatte. Dies wurde für Prostata-, Blasen-, Brust- und Schilddrüsenkrebs von Villanueva et al
[10], [11] gezeigt. Sie berichteten, 61 Signaturpeptide, die gesunde Personen aus drei verschiedenen Arten von Krebspatienten unterscheiden konnte. Während all dieser Peptide und /oder deren Fragmente, die normalerweise im Serum gefunden werden, Unterschiede in der Menge zwischen gesunden und betroffenen Personen beobachtet. Obwohl diese Ergebnisse zeigen das Potenzial, dass Peptidoms Profile für die Krebsdiagnose haben, bleibt es immer noch gezeigt werden, daß dieser Ansatz erweitert werden kann, um Biomarkern entdecken geeignet für die frühe Diagnose und konsequente Überwachung. die Fähigkeit dieser Seren Peptid Biomarkern ersten, zu unterscheiden Patienten Kontrollen wurde meist mit sehr fortgeschrittenen oder metastasierten Tumoren bei Patienten nachgewiesen. Darüber hinaus hat die Robustheit dieser Biomarker in Frage gestellt worden ist; unkontrollierte Variablen, vor allem auf die Unterschiede in der Probenhandhabung zurückzuführen, Verarbeitungsprotokollen und Datenanalyse, wurden [11] gezeigt, drastisch die Ergebnisse dieser Tests zu modifizieren - [19]. Indem großen Wert auf die Probenaufnahme, Handhabung, Verarbeitung, MS-Signalverarbeitung und statistischen Analysen robuster und reproduzierbare Ergebnisse erzielt werden können [18], [20], [21].

In dieser Arbeit haben wir uns auf eine Reihe von Signaturpeptide zu entdecken, die diagnostischen Wert für Magenkrebs haben könnte. Um dies zu erreichen, haben wir drei verschiedene Serumquellen Patienten Magenkrebs in verschiedenen Phasen beteiligt sind. Ein strenges Protokoll zur Serumgewinnung und Verarbeitung angewandt wurde [18], eine zusammenhängende Verfahren der Peptidextraktion und MALDI-TOF-Messungen verwenden, mit einer modifizierten Analyse-Pipeline. die verbesserte Pipeline für die Identifizierung eines Peptidmusters erlaubt zusammen, die zwischen Krebs und Kontrollproben unterscheidet. Diese Ergebnisse wurden auf dem ursprünglichen und neuen Seren bestätigt drei identifizierten Merkmale aus dem Muster, apoC-I (zwei Merkmale) und apoC-III, unter Verwendung von Immuno-basierten Assays. Wir haben dann die Serumspiegel von apoC-I beschäftigt und apoC-III mit CRP und CA19-9 Marker kombiniert Magen-Adenokarzinom-Patienten von Krebs freien Kontrollen zu unterscheiden.

Materialien und Methoden

Serum Ernte und Handhabung

Die Seren wurden von zwei kommerziellen Quellen erhalten. 79 Serumproben von Voroperationsbereich Magenkrebs-Patienten und 33 Serumproben von Krebsfreien Kontrollpersonen (einschließlich Gastritis 10 Patienten) wurden durch RNTech (Paris, Frankreich) in Rumänien gesammelt. Sera Form von Krebs und nicht-Krebs-Patienten wurden nach Fasten über Nacht in der folgenden Weise getroffen: 5 ml Blut in ein VACUETTE Serum Rohr gezogen wurde (CatLj005, Greiner Bio One, Kremsmuenster, Österreich) und links für etwa 30 Minuten gerinnen, danach wurde das Röhrchen bei 3000 Upm auf einer Hettich EBA 20S Zentrifuge (Hettich Ag, Tuttlingen, Deutschland) für 5 Minuten bei Raumtemperatur zentrifugiert. Das abgetrennte Serum wurde in 1 ml Aliquots in sterile Kryoröhrchen (Nalgene, Rochester, NY, USA) und sofort gefroren bei (-70) ° C aliquotiert. 22 Voroperationsbereich Magenkrebs Seren und 21 Kontrollen durch Asterand in der USA gesammelt wurden (Detroit, MI, USA) auf die folgende Weise: 10 ml Blut entnommen wurde, in eine BD Vacutainer SST mit Kunststoffrohr (cat #BEC 367.985, BD , San Jose, CA, USA). Das Rohr wurde durch Invertieren es 5mal gemischt und für etwa 30 Minuten in einer vertikalen Position zu gerinnen. Dieser Schritt wurde durch eine Zentrifugation von 1,100-1,300 g für 10 Minuten bei Raumtemperatur. Das abgetrennte Serum wurde in 1 ml Aliquots in sterile Kryoröhrchen (Nalgene) Röhren und sofort gefroren bei (-70) ° C portioniert. Für die Asterands Quelle wurde das Fasten nicht erhobenen Daten auf einem der Blut in ihrer Bank zieht. Serumproben von beiden Unternehmen wurden auf Trockeneis transportiert und gelagert bei (-70) ° C unmittelbar nach der Ankunft. Sera Proben wurden für etwa eine Stunde auf Eis aufgetaut und eine Hälfte, 50 &mgr; l aliquotiert in lo-bind Röhrchen (Eppendorf, Hamburg, Deutschland) und sofort wieder gefroren bei (-70) ° C. Alle Probenaliquote wurden bei (-70) ° C bis zur Verarbeitung gelagert. Eine dritte Quelle von Seren wurde in unserem Labor von 12 Krebs-frei israelischen Kontrollen erhalten. Das Blut wurde mit dem Rohr Marke gezogen, die von RNTech (CatLj005, Greiner Bio One) und Serum-Behandlung folgte dem Verfahren von RNTech. Die Seren in unserem Labor erhalten wurden, von nicht nüchternen Individuen genommen. Beide RNTech und Asterand Unternehmen haben festgestellt, und führten ihre Aktivitäten nach regulatorischen und ethischen Standards, die Umsetzung von lokalen, nationalen, europäischen, amerikanischen und internationalen (UN) Regeln und Empfehlungen insbesondere dann, wenn für biologisches Material Sammlung und Behandlung und Forschungsergebnis Ausbeutung. Dies umfasst sowohl die schriftliche Zustimmung eines jeden Patienten einen Beitrag zur biologischen und Datenbank, und schriftliche Studie Genehmigung der Ethikkommission der einzelnen Institute klinischen Proben zu der Unternehmen Banken beitragen.

Serum Probenverarbeitung und Vorbereitung für MS- MALDI Lesen

Jede Serumprobe wurde in zwei bis drei Wiederholungen verarbeitet (aus identischen Aliquots und auf separaten Zufallsdaten). Peptide wurden auf Perlen extrahiert mit C8 beschichtet, gewaschen, eluiert, gemischt mit CHCA Matrix und auf der MALDI-Target Platte abgeschieden. Die Seren wurden in Replikaten verarbeitet und auf die MALDI-Platte in Duplikaten abgeschieden. Eine detaillierte Beschreibung finden Sie Datei-S1 zu sehen.

Die Datenanalyse von MALDI Ergebnisse |

Datenverarbeitung in zwei Schritten durchgeführt wurde. Im ersten Schritt wurde eine Intensitätsmatrix aus den rohen ASCII-Dateien von MALDI-TOF-Ablesungen aus allen Seren Probenquellen Neuabtastung, Ausrichten und m /z Peaks Erfassung durchgeführt, wie in Villanueva beschrieben et al
[21]. Im zweiten Schritt wurde maschinelles Lernen verwendet, um ein Unterscheidungsmuster zu definieren, die verwendet werden können, Patienten zu klassifizieren. Zu diesem Zweck ist das Verfahren in Villanueva beschrieben et al
[21] wurde modifiziert, wie unten beschrieben. Die modifizierte Pipeline verlässt sich ganz auf Open-Source-Software und weitere Details werden in der Bioinformatik-Abschnitt in Datei-S1 beschrieben.

(1) Ein Replikat Summierung und Feature Filterschritte wurden hinzugefügt Nullwerte als Sonderfälle zu berücksichtigen. Unsere ursprünglichen Matrix enthielt eine beträchtliche Menge von Nullwerten für verschiedene Funktionen in verschiedenen Proben. Durch allgemeine Begrenzung der MALDI-Technologie konnte ein signifikanter Anteil dieser Nullwerte fehlenden Werte repräsentieren eher als echte Null Intensitäten. Zur teilweisen Überwindung dieser Einschränkung wir jede Probe in Replikaten lesen, und die durchschnittliche Intensität berechnet, ohne auf Null Intensität Lesungen. Im Anschluss an diese Wiederholungs Summierung, die resultierende Matrix enthielt noch erhebliche Menge von Nullwerten. SVM-basierte Modelle könnten nach Nullwerten klassifizieren fehlende Werte darstellen und nicht die echte Null Intensitäten. Daher gefiltert wir Funktionen, die noch in mindestens einer der Proben Null-Werte hatten. Keines dieser Merkmale entfernt hatte klare Präferenz von Nullwerten auf eine spezifische klinische Gruppenzuordnung. Die sich ergebende Untermatrix in einer Maschine verwendet wurde, das Lernen Klassifikation.

(2) Ein neuer Ansatz Auswahl Parametrierung Feature entwickelt. Die Definitionen für SVM-basierte Analyse wurden zunächst wie folgt: RNTech Magen vs. RNTech Kontrolle, Asterands Magen vs. Asterands Kontrolle. Mann-Whitney p-Wert wurde für jeden Peak berechnet, entsprechend der klinischen Gruppen für die Analyse definiert. Wir haben dann Mann-Whitney-p-Werte und Spitzenintensitäten als Cutoffs eine Teilmenge von Funktionen (Peaks), um für den Einsatz in maschinellen Lernens Experimente. Eine Intensität Cutoff hat herauszufiltern nicht Proben, bei denen mindestens eine durchschnittliche Leseintensität getestet für die Spitze über dem Cutoff hatte. Filter-Werte wurden für die beste Leistung in optimiert SVM-basierte Klassifizierer (hergestellt von LIBSVM, linear kernel) nach zehnfache Kreuzvalidierung durch ein Zwei-Schritt-Protokoll. Der erste Schritt definierten Suchbereiche und Intervalle für beide Filter und alle Kombinationen iterieren. Dann wählte die zweite Stufe die Kombination von Werten, die die beste Leistung und kleinste Anzahl von Funktionen zur Verfügung gestellt.

(3) Es wurde ein Normalisierungsschritt hinzugefügt zu steuern, um Cross-Probe und Quer Experiment spannt. Für sera Quellen "Vergleich und Auswahl von Merkmalen ähnliche Trends in beiden Quellen, Quer Quelle Normalisierung der Intensitäten zeigte geführt, um die R-Funktion" Quantil "können Sie definieren 9 Schwellen X 1 | . 9
, die die skalierten Werte in der Steuerklasse in 10 Quantile.

Weitere Methoden der Bioinformatik werden zur Verfügung gestellt in Datei-S1 teilen.

Immuno-basierten kommerziellen und klinischen Tests für die verschiedene Apolipoproteine ​​

ApoC-III und apoB-100 wurden durch Immunoturbidometry auf einer Olympus 400 Autoanalyser gemessen, mit Hilfe der K-Assay-Kits (cat # KAI-006 und 6142, Kamiya Biomedical, Seattle, WA, USA) wie zuvor beschrieben [22]. Im Haus ELISA für apoC-III ist in Datei-S1 beschrieben. ApoC-I-Spiegel wurden unter Verwendung eines AssayMax menschlichen Apolipoprotein C-I-ELISA-Kit (Assaypro, St. Charles, MO, USA) geprüft nach den Anweisungen des Herstellers. Gereinigtes menschliches apoC-I-Standards wurden im Bausatz enthalten.

Ergebnisse |

Die Verwendung von MS-Methode auf Basis der Serum Peptide Signatur für Magenkrebs zu identifizieren

Frühere Studien haben gezeigt, dass gut Designed und sera Peptidomik können Patienten und nicht-Krebs-Kontrollen auf der Grundlage charakteristische Muster von Signaturpeptide im Serum [10], [11] trennen spezifische Krebs-Lager-sorgfältig gesteuert werden. Wir untersuchten, ob diese Ergebnisse für Magenkrebs wiedergegeben werden kann und ob eine solche Trennung für die Analyse von Seren aus verschiedenen Quellen ausreichend ist. Wir analysierten zunächst die Serum-Peptidprofile von 62 Patienten mit Magenkrebs in verschiedenen Stadien, sowie 41 Kontroll Seren von gesunden Probanden. Diese Seren wurden aus zwei Quellen erhalten: (i) RNTech, eine Firma, die Seren in Bukarest, Rumänien gesammelt; und (ii) Asterands, eine Firma, die Seren in den USA gesammelt. Für jede Quelle wurden die Seren mit einem einzigen Standard-klinischen Protokoll gesammelt. Die Protokolle waren vergleichbar z.B. die Art des Röhrchens, die Gerinnungszeit und die anfängliche Gefrieren der Seren (siehe Methoden), doch sind die Blutentnahmeröhrchen waren unterschiedlich. Altersverteilung, Geschlecht und der klinischen Merkmale der 103 Personen in dieser Studie sind in Tabelle 1 und im Detail in Datei S1. Eine Zusammenfassung der klinischen Stadien von Magenkrebs abgeleitete Seren für beide Quellen ist in Tabelle 1 Probenhandhabung gegeben, nachdem die erste Sammlung Uniform war, 2 Gefrier-Auftau-Zyklen beteiligt anfänglichen Lagerung und anschließenden Aliquotierung für Peptid-Extraktion und MS-Analyse zu erreichen. Alle 103 Serumproben wurden manuell bearbeitet, jedoch gleich in einem Schritt Umkehrphasen-Extraktion verwendet wird. Serumproben und Proben Replikate wurden verarbeitet und zufällig an verschiedenen Tagen lesen Vorbereitung Datum assoziierte Verzerrungen zu vermeiden. Alle Seren Herstellung und Abscheidung wurde von derselben Person durchgeführt werden. Ebenso sind alle MALDI Ablesungen wurden nach dem gleichen Techniker durchgeführt. Die MALDI-TOF-Instruments Empfindlichkeit wurde routinemäßig überwacht und ständig während aller Messwerte kalibriert.

Analyse von MS-basierten sera Peptidoms ein 9-Peptid Signatur ergab, dass Magen-Adenokarzinom-Patienten von Krebs frei Kontrollen unterscheiden

insgesamt 637 Massenspitzen (Features) wurden in den 103 untersuchten Proben identifiziert. Die Ergebnisse der MALDI wurden für jede Probe auf einer Matrix enthält, die Signalintensitäten von 637 Massenpeaks (Merkmale) für jede der untersuchten Serumproben mit Replikaten umgewandelt (siehe Methoden, Bioinformatik). Während unüberwachten hierarchischen Clustering alle Funktionen unter Verwendung von nicht Krebs und nicht-Krebsproben, PCA Analyse aller Funktionen für die einzelnen Seren Quelle unterschieden zwischen Krebs und Nicht-Krebs-Proben (Abbildungen S1-S3) trennen. Dies deutete darauf hin, dass Feature Filtration und Auswahl von wesentlicher Bedeutung ist, bevor die Maschine lernbasierte Einsatz Klassifikation. Deshalb wandten wir (i) eine Funktion, Filtration und Auswahlschritt und (ii) verwendet Mann-Whitney-p-Werte und Spitzenintensitäten als Cutoffs eine Teilmenge von Funktionen (Peaks), um für den Einsatz in maschinellen Lernens Experimente. (Siehe Methoden, Bioinformatik). Wir analysierten dann innerhalb jeder Quelle (RNTech und Asterand), ob Seren von Patienten und Kontrollen getrennt werden konnten. Wir erhielten gute Ergebnisse für jeden der Single-Source-Klassifizierer; SVM-basierte Klassifizierer für RNTech und Asterand hatte 90,0% und 93,0% Genauigkeiten vorhergesagt bzw. nach zehnfache Kreuzvalidierung des Trainingssatzes (Tabelle 2A). Zufällige Schlurfen von Gruppenmitgliedern führte zu deutlich höheren p-Werte (zum Beispiel 0,8) und niedriger vorhergesagte Genauigkeit bei trainierten Modelle für jede sera Quelle. Dies zeigte die Bedeutung der klinischen Bedingungen für die Einstufung in zwei klinisch definierten Gruppen innerhalb der einzelnen Seren Quelle. Allerdings führen die Single-Source-Klassifizierer nicht gut auf die andere Quelle der Proben korrekt klinischen Status der Vorhersage nur in 35/60 Proben (Asterand auf RNTech) und 25/43 (RNTech auf Asterands) (Tabelle 2A). Daher Source-Vorspannung von Peptidoms hat eine erhebliche Auswirkung auf die Genauigkeit der Vorhersage.

Die Unfähigkeit der Modelle auf eine Quelle ausgebildeten ausreichend klinischen Zuständen von Ablesungen von der anderen Quelle (Tabelle 2A) zur Vorhersage besser dargestellt wird, wenn die Überprüfung die Features durch die quellenspezifische Classifier (Tabelle 3) ausgewählt. Einige der Funktionen, die auf einer Hand gut gearbeitet zeigte eine entgegengesetzte Tendenz auf der anderen Quelle. Andere waren wichtig für die Klassifizierung in einer Hand, aber wenig oder keine Wirkung in der anderen hatte. Diese Beobachtungen führten uns zu einer vergleichenden Analyse der Daten aus beiden Quellen. Wir produzierten Box-Plots für alle Spitzenintensitäten, nach klinischen Gruppen. Diese Diagramme zeigen, dass, wenn die Steuerung und Krebs Intensitäten vergleicht für jede Funktion innerhalb einer Quelle, beobachtet der Trend zwischen den beiden Quellen (z.B. m /z 1520, 1A) unterscheiden. Selbst wenn der Trend in beiden Quellen persistent war, konnte die Intensitätswerte unterschiedlich sein (beispielsweise m /z 6431; RNTech höher als Asterand, 1B). Um ein Vorhersagemodell zu schaffen, die wir brauchten, um (i) Verwerfungsquellenspezifische Phänomene, und (ii) einen Normalisierungsschritt hinzufügen, die die Wirkung von verschiedenen Intensitätsstufen, wo der Trend wurde beibehalten reduzieren würde.

Die verwenden des gemischten Datensatz mit einem Mann-Whitney-p-Wert Cutoff für Feature-Auswahl verwerfen quellenspezifische Phänomene könnten. Peaks, die unterschiedlichen Trends in verschiedenen Quellen zeigten würde nicht für die klinische gruppenbasierte Trennung im gemischten Satz von Bedeutung sein; Merkmal 1520 gegenläufiger Trend zwischen den Quellen zu manifestieren, wurde von jedem einzelnen Quellklassifizierer (1A, Tabelle 3) ausgewählt. Daher trug sie auf den Mangel an erfolgreichen Leistung jedes einzelnen Quellklassifizierer auf der anderen Quelle (Tabelle 2A). Wie erwartet, wurde diese Funktion nicht von jedem Modell ausgewählt auf dem gemischten Satz basiert. Wir haben eine gemischte Daten eingestellt, während zufällig 21 Magenkrebs-Proben aus dem gemischten Trainingssatz zu entfernen, und verwendet, um diese 21 entnommenen Proben für die Validierung. Darüber hinaus haben wir die 12 Krebs-freie Kontrollproben in unserem Labor als unabhängige Kontrolle Validierungssatz gesammelt. Das Modell wurde in Übereinstimmung mit einer maximalen ausgewählten vorhergesagten Genauigkeit nach einer zehnfachen Kreuzvalidierung, wie zuvor. Die beste Scoring-Modell für den gemischten Satz wurde mit 9 Funktionen (Mann-Whitney-p-Wert von 0,044 Filter) und hatte eine vorhergesagte Genauigkeit von 84,1% nach zehnfache Kreuzvalidierung des Trainingssatzes. Wichtig ist, dass es genau vorhergesagt 12.10 israelischen Kontrollen. Doch dieser Klassifikator unzureichend vorhergesagt (13 von 21) die 21 entfernt gemischten Magenkrebs Proben für die Validierung verwendet.

Um daher die Wirkung der Quelle bezogenen Unterschiede in der Intensitätsstufen zu reduzieren, wurde die Filterleistung in Merkmalsauswahl verbessert, indem ein Quantil Normalisierungsschritt einzuführen. Diese Normalisierung wurde gemäß Kontrollen jeder sera Quelle durchgeführt unabhängig von den anderen Quellen (siehe Methoden, Bioinformatik). Für Funktionen, wie zB m /z 6431 mit einem anhaltenden Trend in beiden Quellen, korrigiert dieser Schritt die Intensität Vorspannung (1D). Tatsächlich wurde 6431 Funktion nicht für die nicht-normalisierten Mischungs basierenden Klassierer ausgewählt. Es wurde jedoch für den normalisierten Mischungsbasis Klassifikator (Tabelle 3) ausgewählt. Doch für Funktionen wie m /z 1520 mit entgegengesetzten Trends in beiden Quellen, könnte dieser Schritt nicht den Trend zu ändern, wie erwartet (Abbildung 1C).

Wir testeten die Quantil Normalisierung der Wirkung durch die Anwendung vor der Mittelung und Merkmalsauswahl. Um zu beurteilen, besser die Vorhersagegenauigkeit wir die Matthews Korrelationskoeffizient (MCC) Maßnahme eingesetzt. MCC wird in maschinellen Lernens als Maß für die Qualität der binären (zwei Klasse) Klassifikationen und gibt einen Wert zwischen -1 und +1 verwendet. Ein Koeffizient von 1 stellt eine perfekte Vorhersage, 0 eine durchschnittliche zufällige Vorhersage und -1 eine inverse Vorhersage. MCC ist allgemein als eine ausgeglichene Maßnahme angesehen, die auch verwendet werden können, wenn die Klassen von verschiedenen Größen sind. Damit haben wir die MCC für verschiedene Klassifikationsversuche berechnet, um den Effekt zu zeigen, dass eine Normalisierung auf Klassifizierung hatte. Die Ergebnisse sind in Tabelle 2 gezeigt Hinweis, dass ohne Normierung, MCC relativ hoch für den Trainingssatz war, noch zeigte mittelmäßige Leistung auf dem Validierungssatz (Tabelle 2). Der Normalisierungsschritt ergab ähnliche hohe MCC-Werte für die Ausbildung und Validierungssätze (Tabelle 2). Der Normalisierungsschritt Quer Source-Vorspannung zu steuern, nicht die Notwendigkeit des maschinellen Lernens basierten Klassifikator für nichtig zu erklären ein Unterscheidungsmuster zu definieren; PCA der beiden Quellen gemischten normalisierte Datensätzen führte wieder zu einer schlechten Trennung zwischen den Proben Krebs und Kontrolle Magen (Abbildung S4).

Immuno-basierte Validierung für Features apoC-I und apoC-III darstellt

der Klassifikator resultierte aus dem gemischten Datensatz nach Quantils Normalisierungsschritt, 9 verwendeten Funktionen (Tabelle 2). Drei der neun Funktionen beteiligt Apolipoproteine: apoC-III (Funktion 9443) und apoC-I (Merkmale 6431 und 6629, Tabelle 3). Um die MALDI-basierte Ergebnisse überprüfen wir zunächst einen ELISA-Test für den qualitativen Nachweis von apoC-III im Serum entwickelt (siehe Methoden) und getestet alle Serumproben von Asterand und RNTech. Ergebnisse des ELISA folgte dem Trend der MALDI Ergebnisse (2A, B); Intensität der apoC-III war signifikant höher als bei Kontrollgruppen, wie in den beiden Seren Quellen Krebs Gruppen verglichen. Wir untersucht weiter die Korrelation zwischen apoC-III ELISA und 9443 MALDI Ergebnisse für jede Probe; ELISA und MALDI Ergebnisse zeigten eine signifikante Korrelation (p < 0,0001, Kendall-RAN Korrelation tau). Wir schickten dann sera Aliquots von fast allen Proben (gleiche Gefrierzustand) zu einem externen klinischen Labor für immunoturbidity-basierte quantitative Assay für apoC-III [22]. Die Ergebnisse wurden in mg /dl (2C) und, wie oben, die Menge der apoC-III war signifikant höher als bei den Kontrollgruppen beider Seren Quellen.

die apoC-I MALDI Ergebnisse zu überprüfen, beschäftigten wir kommerzielle quantitative ELISA-Kit, das apoC-I-Standards enthält und erkennt beide 6431 und 6629 Varianten von apoC-I. Die Ergebnisse wurden in pg /ml (3B) und anschließend das Muster für die MALDI Ergebnisse (Figuren 1D und 3A) beobachtet erhalten; Die Intensität der apoC-I war signifikant höher als bei der Kontrollgruppe, wie in den beiden Seren Quellen zu Krebsgruppen verglichen. Um die Spezifität von apoC-I und apoC-III Reduktion in den Seren von Magenkrebs tragenden Patienten beurteilen zu können, wir getestet apoB-100 Levels. Die Proben für apoC-III in der externen klinischen Labor getestet wurden parallel für apoB-100 Levels mit immunoturbidity basierten quantitativen Assay getestet. Die Ergebnisse wurden in mg /dl (Figur 3C) und zeigte keinen signifikanten Trend zwischen Kontrolle und Magenkrebs-tragenden Gruppen erhalten. Deshalb haben wir die Verwendung der apoB-100 ergibt sich als Normierungsfaktor für die bioinformatische Analyse der quantitativen apoC-I und apoC-III-Ergebnisse (3C, 3B, 2C, beziehungsweise).

machen könnte analysiert Wir klinisch apoC-I, apoC-III und apoB-100 für zusätzliche Proben von Magenkrebspatienten und Krebs-freie Kontrollen (RNTech Quelle, gleiche gefrier Zustand, darunter 10 Gastritis Patienten in den Krebs-freie Kontrollen; Anmerkung Tabelle 1 für die Gesamt Probennummern). Wir haben auch klinisch CA19-9 und CRP-Werte für alle Proben (gleiche gefrier Zustand) analysiert. Wir beschäftigten dann Clementine 10.0 Software auf den RNTech Proben zu beurteilen, ob festgelegten Regeln auf Basis von apoB-100-normalisierte CI und C-III, CA19-9 und CRP-Serumspiegel verwendet werden kann zwischen Seren von Kontrolle und Magenkrebs Gruppen von RNTech zu klassifizieren Quelle als Trainingsquelle. Die Kombination aller vier Parameter ergab Genauigkeit bessere Vorhersage im Vergleich zur Kombination von weniger als 4 Parameter (Abbildung 4 und Daten nicht gezeigt). Vorhersagegenauigkeit des Trainingssatzes war 88,4%. Wir verwendeten die RNTech erhaltenen Regeln für die Asterands Quelle und Vorhersagegenauigkeit war 74,4% (Abbildung 4). Für Training und Validierung war die Empfindlichkeit ausgezeichnet (87/90 kombiniert), aber die Spezifität war weniger genau (37/52 kombiniert).

Diskussion

In den letzten Jahren eine ganze Reihe von Berichten beschreiben MS-Serum identifiziert Biomarker /Unterschriften für Krebszustände wurden als falsch erwiesen [5], [18]. Verschiedene Quellen von Bias wurden einschließlich Probenauswahl beschrieben, Handhabung, Verarbeitung, Lesen und Analyse [18], [20], [21]. Nach dem Entfernen von Bias-Faktoren wurde gezeigt, dass SELDI-TOF-MS ganze Serum Proteomanalyse mit IMAC Oberfläche zuverlässig Prostatakrebs erkennen nicht [23]. Daher schlug die Autoren, dass es unwahrscheinlich ist, dass ein Massenspektrometrie-Ansatz nicht verarbeitete Serum unter Verwendung von Männern mit und ohne Prostatakrebs unterscheiden würde [24]. Auf der anderen Seite, andere neue MALDI-TOF-basierte Studien, die in diesem Bias-Faktoren und verwendet ein einstufiges sera Verarbeitungstechnik vermieden identifiziert Unterscheidung Biomarker-Signaturen für verschiedene Krebsarten wie Prostatakrebs [11].

Studie nahmen wir den einen Schritt sera Verarbeitung Ansatz zur Identifizierung eines Peptidoms-basierte Signatur Seren von Magen-Adenokarzinom-Patienten abgeleitet zu unterscheiden. Wir machten einen angemessenen Aufwand zu vermeiden zuvor berichtet Bias Faktoren [18]. Wir analysierten Seren von zwei biorepositories. Wir beobachteten, dass, selbst wenn sera Handhabung, Verarbeitung, MALDI Lesen und Analyse sind die gleichen, Peptidoms Analyse durch die Biobanken vorgespannt ist. Neben den sozio geografischen Unterschiede (Rumänien und USA als Quelle für die Proben in RNTech und Asterand, jeweils), die quellenbezogene Voreingenommenheit aufgrund der Marke des Blutentnahmeschlauch, in den verschiedenen biorepositories verwendet werden könnten.

Wir haben dann eine Mischprobe Satz von zwei Seren Quellen für Merkmalsselektion und hinzugefügt, um eine Quer Quelle Normalisierungsschritt für Source-Vorspannung zu kompensieren. Wir fanden heraus, dass (i) die Verwendung des gemischten Datensatz mit einem Mann-Whitney-p-Wert Cutoff für Merkmalsselektion könnte quellenspezifische Merkmale zu verwerfen, und (ii) eine Quantil Normalisierungsschritt (für maschinelles Lernen) teilweise übereinstimmende Merkmale auszuwählen hilft in denen sind die Trends zwischen Quellen concordant, aber Intensitätsstufen unterscheiden sich zwischen den Quellen. Die Notwendigkeit einer Normalisierung, wenn sie mit Proben aus verschiedenen Quellen handelt, wurde bereits für die Microarray-basierte Hochdurchsatz-Technologie [25] gezeigt. Es ist gut, dass Variationen in experimentellen Verfahren etabliert und unkontrollierten Bedingungen (zB sozio geographischen Herkunft der Proben) zu systemischen Messfehler führen kann.

, um die Änderungen nach, wir einen Quer Quelle Serum Peptid Signatur etabliert Magen zur Unterscheidung Krebspatienten von nicht-Krebs-Kontrollen. Drei der Peptide entsprach apoC-I und apoC-III. Wir validiert unser MALDI-basierte Ergebnisse mit unabhängigen analytischen Methoden, die auf Immunoassays basieren [26]. Das Peptid Signatur enthalten apoC-III und apoC-I abgeleiteten Funktionen. Die Ergebnisse aus der unabhängigen Quantifizierung ihrer Serumspiegel folgte der von der MS-Ansatz identifiziert Trend.

Unsere Studie ist die erste ist, dass die Serumspiegel von apoC-I und apoC-III berichten können als potentielle Biomarker für Magen verwendet werden Krebs. Es ist wahr, dass die jüngsten Berichte haben gezeigt, dass Apolipoproteine ​​"Spiegel im Blut potentielle Biomarker für verschiedene Krebsarten sein könnte. ApoC-I wurde als potenzieller Serum Biomarker für Darmkrebs, Hormon-resistentem Prostatakrebs und Leberfibrose identifiziert [27] - [29]. Andere Berichte zeigten, dass apoC-III könnte auch ein potentieller Biomarker in Bauchspeicheldrüsenkrebs und Brustkrebs sein [30], [31]. Allerdings beschäftigt alle diese Berichte-MALDI basierten Screening und wurde nicht bestätigt ihre Ergebnisse mit Immun-basierten oder anderen Tests. Ebenso wenig haben sie studieren Seren aus einer anderen Quelle als Validierungsgruppe.

Unsere Ergebnisse weiter aufgewendet und validiert werden soll, wie beschrieben [32], [33]. Dennoch führt der klinische Validierung apoC-I und apoC-III uns veran weiter einen diagnostischen Assay Biomarkern basierend auf Serum erforschen, die ohne die Notwendigkeit für MS-Technologie in der Klinik untersucht werden konnte. Regeln unter Verwendung von apoB-100-normalisierten C-I und C-III, CA19-9 und CRP quantitative Serumspiegel für die RNTech Quelle erzeugt und validiert die unabhängige Asterand Quelle hatte Vorhersagegenauigkeit von 88,4% bzw. 74,4% betragen. Daher überwindet die Verwendung dieser 4 klinischen Merkmale teilweise die Source-Vorspannung.

Other Languages