Estratto
Trovare nuovi biomarcatori del peptide per il cancro allo stomaco nel siero umano che può essere implementato in un metodo di previsione clinicamente praticabile per il monitoraggio del cancro allo stomaco. Abbiamo studiato il peptidoma siero di due biorepositories differenti. Per prima impiegato un approccio cromatografia liquida fase C8-inversa per la purificazione del campione, seguita da analisi spettrometria di massa. Questi sono stati applicati su campioni di siero dai controlli privi di tumore e pazienti affetti da cancro allo stomaco a vari stadi clinici. Abbiamo quindi creato una pipeline di analisi bioinformatica e identificato firma peptide discriminare i pazienti con adenocarcinoma dello stomaco dai controlli privi di tumore. Matrix Assisted Laser desorbimento /ionizzazione-Time of Flight (MALDI-TOF) i risultati di 103 campioni ha rivelato 9 peptidi di firma; con una precisione di previsione del 89% nel set di formazione e 88% nel set di validazione. Tre dei peptidi discriminanti scoperte erano frammenti di apolipoproteine C-I e C-III (apoC-I e C-III); abbiamo quantificato ulteriormente i loro livelli sierici, così come CA19-9 e CRP, impiegando saggi commerciale-cliniche quantitative in 142 campioni. Ap-I e apoC-III risultati quantitativi correlati con i risultati MS. Abbiamo poi impiegato apoB-100-normalizzato apoC-I e apoC-III, CA19-9 e livelli di CRP per generare regole stabilite per la previsione cancro allo stomaco. Per la formazione, abbiamo utilizzato i sieri da un repository, e per la validazione, abbiamo usato sieri dal secondo repository. precisioni previsione del 88,4% e il 74,4% sono stati ottenuti nei set di addestramento e di validazione, rispettivamente. I livelli sierici di apoC-I e apoC-III in combinazione con altri parametri clinici possono servire come base per la formulazione di un punteggio diagnostico per i malati di cancro allo stomaco
Visto:. Cohen M, Yossef R, T Erez, Kugel A, M Welt, Karpasas MM, et al. (2011) Siero Apolipoproteine C-I e C-III sono ridotti nel cancro dello stomaco Pazienti: I risultati di MALDI-Based peptidoma e saggi clinici Immuno-Based. PLoS ONE 6 (1): e14540. doi: 10.1371 /journal.pone.0014540
Editor: Hana Algül, Technische Universität München, Germania |
Ricevuto: 1 Luglio, 2010; Accettato: 22 novembre 2010; Pubblicato: 18 gen 2011
Copyright: © 2011 Cohen et al. Questo è un articolo ad accesso libero distribuito sotto i termini della Creative Commons Attribution License, che permette l'uso senza restrizioni, la distribuzione e la riproduzione con qualsiasi mezzo, a condizione che l'autore originale e la fonte sono accreditati
Finanziamento:. Il finanziamento è stato fornita dalla Comunità europea (FP6 GLYFDIS 037.661). RNTech SAS Francia è indicato come finanziatore a causa del fatto che JT e HB sono /erano dipendenti di questa azienda; i contributi di JT e HB sono definite come l'approvazione finale della versione da pubblicare, e che non sono stati coinvolti in contributo alla ideazione e progettazione, o di acquisizione dei dati, o l'analisi e l'interpretazione dei dati e stesura del manoscritto. I finanziatori avevano alcun ruolo nel disegno dello studio, la raccolta e l'analisi dei dati, la decisione di pubblicare, o preparazione del manoscritto
Conflitto di interessi:. Il fatto che due ex dipendenti o attuali delle RNTech SAS Francia sono gli autori di questo manoscritto non altera l'adesione a tutte le PLoS ONE politiche in materia di condivisione dei dati e dei materiali, come dettagliato nella guida on-line per gli autori.
Introduzione
i tassi di mortalità di molti tumori non sono cambiate drasticamente nel ultimi 20 anni [1]. La diagnosi precoce ha dimostrato di migliorare notevolmente l'efficacia del trattamento del cancro, eppure rilevamento è spesso possibile solo dopo la comparsa dei primi sintomi clinici, che in alcuni tumori si verifica troppo tardi per intervento riuscito. Ciò è dovuto alla mancanza di test specifici e sensibili che permettono lo screening e il monitoraggio degli stati cancerose. Pertanto, la scoperta di biomarcatori tumorali romanzo è sempre considerato fondamentale per migliorare il trattamento del cancro. Negli ultimi dieci anni, molti studi si sono concentrati su scoperta di biomarcatori. Una delle fonti più promettenti per la scoperta di biomarcatori è il sangue umano, in particolare siero e nel plasma, che può riflettere molti eventi nel corpo, in tempo reale. Tuttavia, nonostante gli sforzi immense, solo un piccolo numero di proteine plasmatiche hanno dimostrato di avere un valore diagnostico [2] - [5]. Spesso, questi biomarcatori non stare da soli e sono accompagnati da altri test per il monitoraggio e la diagnosi. La maggior parte di loro non sono specifici e abbastanza sensibili per la diagnosi grande schermo [6], [7].
Una possibile fonte di nuovi biomarcatori cancro è la peptidoma. La logica alla base concentrandosi su peptidi del siero si basa su prove che la formazione e lo sviluppo del cancro comporta cambiamenti nel metabolismo delle proteine e dei peptidi ', e la maggiore disponibilità di metodologie per lo screening dell'intera peptidoma. In termini di sviluppo del cancro, cambiamenti possono verificarsi nella matrice di peptidi intra ed extra-cellulari rappresentati nel peptidoma sangue, che possono essere specifici alla fase cancerose, e quindi hanno un potenziale diagnostico [2], [4], [ ,,,0],5]. In termini di tecnologia di rilevamento, recenti progressi nella tecnologia MS consentono il rilevamento di centinaia di peptidi da pochi microlitri di siero [8], [9]. In effetti, studi precedenti peptidoma sangue hanno riportato una serie di peptidi firma nel siero che erano distinti sano da pazienti affetti da cancro (recensione in [5]). Ciò è stato dimostrato per la prostata, della vescica, della mammella e cancro alla tiroide da Villanueva [11] et al In questo lavoro, abbiamo messo a fuoco a scoprire una serie di peptidi di firma che potrebbero avere valore diagnostico per il cancro allo stomaco. Per realizzare questo, abbiamo utilizzato tre diverse fonti sierici condotti su pazienti di cancro allo stomaco in diverse fasi. Un protocollo rigorosi per la raccolta e l'elaborazione del siero è stato applicato [18], utilizzando una procedura coerente di estrazione peptide e letture MALDI-TOF, con una condotta un'analisi modificata. Insieme, la tubazione migliorata consentito per l'identificazione di un modello peptide che discrimina tra campioni di cancro e di controllo. Questi risultati sono stati confermati sul sieri originale e nuovo per tre caratteristiche individuate dal modello, apoC-I (due caratteristiche) e apoC-III, utilizzando saggi immuno-based. Abbiamo poi impiegato livelli sierici di apoC-I e apoC-III in combinazione con CRP e CA19-9 marcatori per discriminare i pazienti con adenocarcinoma dello stomaco dai controlli privi di tumore. Siero raccolta e la gestione I sieri sono stati ottenuti da due fonti commerciali. 79 campioni di siero da pre-operazione pazienti affetti da cancro dello stomaco e 33 campioni di siero da controlli appaiati cancro-free (tra cui 10 pazienti gastrite) sono stati raccolti da RNTech (Parigi, Francia) in Romania. cancro modulo Sera e pazienti non oncologici sono state prese dopo il digiuno durante la notte nel modo seguente: 5 ml di sangue è stato redatto in una provetta VACUETTE siero (CatLj005, Greiner Bio One, Kremsmuenster, Austria) e lasciato a coagulare per circa 30 minuti, dopo che il tubo è stato centrifugato a 3000 rpm su un Hettich EBA 20S centrifuga (Hettich Ag, Tuttlingen, Germania) per 5 minuti a temperatura ambiente. Il siero separato è stato aliquotato in 1 ml aliquote in sterili tubi criogenici (Nalgene, Rochester, NY, USA) e subito congelato a (-70) ° C. 22 pre-operazione cancro allo stomaco sieri e 21 controlli sono stati raccolti da Asterand negli Stati Uniti (Detroit, MI, USA) nel modo seguente: 10 ml di sangue è stato redatto in un vacutainer SST più plastica tubo BD (cat #BEC 367.985, BD , San Jose, CA, USA). Il tubo è stato mescolato per inversione 5 volte e lasciato coagulare per circa 30 minuti in una posizione verticale. Questa fase è stata seguita da una centrifugazione di 1,100-1,300 g per 10 minuti a temperatura ambiente. Il siero separato è stato aliquotato in 1 ml aliquote in sterili tubi criogenici tubi (Nalgene) e subito congelato a (-70) ° C. Per la fonte Asterand, dati il digiuno non sono stati raccolti su uno dei prelievi di sangue nella propria banca. Sera campioni di entrambe le società sono stati trasportati in ghiaccio secco e conservati a (-70) ° C immediatamente dopo l'arrivo. campioni di siero sono stati scongelati in ghiaccio per circa un'ora e mezza, 50 microlitri è stato aliquotati in provette lo-bind (Eppendorf, Amburgo, Germania) e subito nuovamente congelati a (-70) ° C. Tutti aliquote di campioni sono stati conservati a (-70) ° C fino lavorazione. Una terza fonte di sieri è stato ottenuto nel nostro laboratorio da 12 controlli israeliani cancro-free. Il sangue è stato disegnato con il marchio tubo utilizzato per RNTech (CatLj005, Greiner Bio One) e la gestione del siero ha seguito la procedura di RNTech. I sieri ottenuti nel nostro laboratorio sono state prese da individui non a digiuno. Entrambe le società RNTech e Asterand hanno stabilito e condotto le loro attività secondo gli standard normativi ed etici, attuazione locale, nazionale, europeo, le regole e le raccomandazioni internazionali (ONU) degli Stati Uniti e in particolare quando utilizzabile per la raccolta di materiale biologico e trattamento e valorizzazione risultato della ricerca. Questo include sia il consenso scritto di ciascun contribuendo paziente alla banca biologica e dei dati, e l'autorizzazione di studio scritta da parte del comitato etico di ogni istituto clinico contribuendo campioni alle banche delle società. Ogni campione di siero è stato elaborato in due o tre repliche (da aliquote identiche e in date casuali separati). Peptidi sono state estratte le perline rivestite con C8, lavato, eluito, mescolato con matrice CHCA, e depositati sulla piastra segnale MALDI. I sieri sono stati trasformati in replicati e depositato sulla piastra MALDI in duplicati. Per una descrizione dettagliata si veda S1 File. Il trattamento dei dati è stata effettuata in due fasi. Nella prima fase, una matrice di intensità è stata eseguita dai file ASCII prime di MALDI-TOF letture da tutte le fonti di esempio sieri usando ricampionamento, allineamento e rilevamento m /z picchi come descritto in Villanueva et al (1) Una somma replicare e dispongono di passaggi filtranti sono stati aggiunti a considerare valori zero come casi particolari. La nostra matrice originale conteneva una notevole quantità di valori zero per caratteristiche diverse in campioni diversi. A causa della limitazione generale della tecnologia MALDI, una frazione significativa di questi valori zero potrebbe rappresentare valori mancanti, piuttosto che zero reale intensità. Per superare in parte questa limitazione si legge ogni campione in replicati, e calcolato l'intensità media, ignorando letture zero intensità. A seguito di questa somma replica, la matrice ha portato conteneva ancora notevole quantità di valori zero. modelli SVM-based potrebbero classificare secondo i valori zero che rappresentano valori mancanti e non zero reale intensità. Pertanto, filtrati caratteristiche che avevano ancora valori zero in almeno uno dei campioni. Nessuna di queste caratteristiche rimosse aveva chiara preferenza di valori pari a zero a uno specifico incarico gruppo clinico. Il sub-matrice risultante è stato utilizzato in una macchina di apprendimento di classificazione. (2) Un nuovo approccio per caratterizzare selezione parametrizzazione è stato sviluppato. Le definizioni per l'analisi SVM-based sono stati inizialmente i seguenti: RNTech stomaco vs controllo RNTech, Asterand stomaco rispetto al controllo Asterand. Mann-Whitney p-valore è stato calcolato per ciascun picco, secondo gruppi clinici definiti per l'analisi. Abbiamo poi utilizzato valori di p Mann-Whitney e intensità dei picchi, come tagli per selezionare un sottoinsieme di funzionalità (picchi) per l'utilizzo in esperimenti di apprendimento automatico. Un cutoff intensità non filtrare i campioni in cui almeno una lettura media aveva intensità di sopra della soglia per il picco testato. valori di filtro sono state ottimizzate per le migliori prestazioni in classificatori SVM-based (prodotto da LIBSVM, kernel lineare) secondo di dieci volte la convalida incrociata da un protocollo in due fasi. Il primo passo definito intervalli di ricerca e gli intervalli per entrambi i filtri e l'iterazione di tutte le combinazioni. Poi, il secondo passo selezionato la combinazione di valori, che hanno fornito le migliori prestazioni e minor numero di caratteristiche. (3) Un passo di normalizzazione è stato aggiunto al controllo per il cross-campione e cross-esperimento pregiudizi. Per il confronto e la selezione di caratteristiche che mostrano tendenze simili in entrambe le fonti fonti sera ', cross-fonte normalizzazione della intensità è stata effettuata utilizzando la funzione R "quantile" per definire le soglie 9 X 1 Ulteriori metodi di bioinformatica sono forniti in S1 File. Immuno-based analisi commerciali e clinici per la diverse apolipoproteine Ap-III e apoB-100 livelli sono stati misurati da Immunoturbidometry su una Olympus 400 autoanalyzer, utilizzando i kit K-test (cat # KAI-006 e 6142, Kamiya Biomediche, Seattle, WA, USA) come precedentemente descritto [22]. In casa ELISA per apoC-III è descritto in S1 file. livelli di Ap-I sono stati testati utilizzando un kit di AssayMax umana Apolipoproteina C-I ELISA (Assaypro, St. Charles, MO, USA) secondo le istruzioni del produttore. standard apoC-I umani purificati sono stati inclusi nel kit. Risultati L'uso del metodo di MS-based per individuare firma peptidi del siero per il cancro dello stomaco Studi precedenti hanno dimostrato che ben peptidomics sieri Ha progettato e accuratamente controllati in grado di separare i malati di cancro-cuscinetto specifici e controlli non tumorali sulla base di modelli distintivi di peptidi firma nel siero [10], [11]. Abbiamo studiato se questi risultati possono essere riprodotti per il cancro dello stomaco e se tale separazione è sufficiente per l'analisi dei sieri da fonti diverse. In primo luogo abbiamo analizzato i profili di siero peptide di 62 pazienti con cancro allo stomaco in diverse fasi, nonché 41 sieri di controllo da volontari sani. Questi sieri sono stati ottenuti da due fonti: (i) RNTech, una società che ha raccolto sieri a Bucarest, Romania; e (ii) Asterand, una società che ha raccolto sieri negli Stati Uniti. Per ogni fonte, i sieri sono stati raccolti utilizzando un unico protocollo clinico standard. I protocolli sono stati paragonabili ad esempio il tipo di tubo, il tempo di coagulazione e il congelamento iniziale del siero (vedi Metodi), ma i tubi di prelievo di sangue erano diverse. Distribuzione per età, sesso e le caratteristiche cliniche dei 103 individui inclusi in questo studio sono riportati nella Tabella 1 e più in dettaglio in S1 file. Una sintesi di stadi clinici di stomaco sieri tumore-derivato per entrambe le fonti è riportato nella tabella 1. la gestione del campione dopo la raccolta iniziale era uniforme, che coinvolge 2 cicli di gelo-disgelo per realizzare lo stoccaggio e la successiva suddivisione in aliquote per l'estrazione del peptide e l'analisi MS. Tutti i campioni di siero di 103 sono stati trattati manualmente, ma identico impiegando una fase di estrazione fase inversa. campioni di siero e replicati campioni sono stati elaborati e leggere in modo casuale in date diverse per evitare la preparazione data associata bias. Tutto preparazione sieri e la deposizione è stata eseguita dallo stesso individuo. Analogamente, tutte le letture MALDI stati eseguiti dallo stesso tecnico. La sensibilità dello strumento MALDI-TOF è stata monitorata regolarmente e costantemente tarato durante tutte le letture. Analisi di peptidoma sieri MS-based ha rivelato una firma 9-peptide che contraddistinguono i pazienti con adenocarcinoma dello stomaco dai controlli liberi da cancro totale di 637 picchi di massa (caratteristiche) sono stati identificati nei campioni studiati 103. I risultati della MALDI sono stati convertiti in una matrice contenente le intensità dei picchi 637 massa (caratteristiche) per ciascuno dei campioni di siero studiati con repliche per ogni campione di segnale (vedi metodi, bioinformatica). Mentre non supervisionato il clustering gerarchico utilizzando tutte le funzioni non separare i campioni tumorali e non tumorali, analisi PCA di tutte le funzioni per ciascuna sorgente sieri differenziato tra cancro e campioni non tumorali (Figure S1-S3). Questo suggerisce che la funzione di filtraggio e la selezione è essenziale prima di assumere la classificazione di apprendimento basati su macchina. Perciò (i) applicato un passo funzione di filtraggio e la selezione e (ii) impiegato p-value di Mann-Whitney e intensità dei picchi, come tagli per selezionare un sottoinsieme di funzionalità (picchi) per l'utilizzo in esperimenti di apprendimento automatico. (Vedi metodi, bioinformatica). Abbiamo poi analizzato all'interno di ogni sorgente (RNTech e Asterand) se sieri dei pazienti e controlli potrebbe essere segregato. Abbiamo ricevuto buoni risultati per ciascuno dei classificatori singolo-source; classificatori SVM-based per RNTech e Asterand avevano 90,0% e il 93,0% del predetto precisioni, rispettivamente, secondo dieci volte la convalida incrociata del training set (2A Tabella). rimescolamento casuale dei membri del gruppo ha comportato p-value molto più elevati (ad esempio 0,8) e basso grado di precisione previsto nei modelli addestrati per ogni sorgente sieri. Ciò indica l'importanza di condizioni cliniche per la classificazione in due gruppi clinicamente definiti all'interno di ogni fonte di sieri. Tuttavia, i classificatori singola fonte non ha un buon rendimento sui campioni di altra origine, la previsione dello stato correttamente clinica solo in 35/60 campioni (Asterand su RNTech) e 25/43 (RNTech su Asterand) (Tabella 2A). Pertanto, pregiudizi fonte di peptidoma ha un effetto significativo sulla precisione della previsione. L'incapacità di modelli addestrati su una fonte di prevedere in modo adeguato le condizioni cliniche di letture l'altra fonte (Tabella 2A) è meglio presentata al momento del check caratteristiche selezionate dai classificatori specifici dell'origine (Tabella 3). Alcune delle caratteristiche che funzionava bene su una fonte ha mostrato una tendenza opposta sull'altro fonte. Altri sono stati importanti per la classificazione in una fonte, ma ha avuto poco o nessun effetto nell'altro. Queste osservazioni ci hanno portato a un'analisi comparativa dei dati provenienti da entrambe le fonti. Abbiamo prodotto box plot per tutte le intensità di picco, secondo i gruppi clinici. Questi grafici hanno dimostrato che quando si confrontano controllo e cancro intensità per ogni caratteristica all'interno di una sorgente, la tendenza osservata potrebbe differire tra le due sorgenti (ad esempio m /z 1520, figura 1A). Anche quando la tendenza era persistente in entrambe le fonti, i valori di intensità potrebbero essere diversi (ad esempio m /z 6431; RNTech superiore Asterand, Figura 1B). Al fine di creare un modello di previsione, abbiamo bisogno di (i) degli scarti di origine specifici fenomeni, e (ii) aggiungere un passaggio di normalizzazione che ridurrebbe l'effetto di diversi livelli di intensità in cui è stata mantenuta la tendenza. Il usare del set di dati mescolato con una Mann-Whitney p-valore soglia per la selezione funzione potrebbe eliminare fenomeni specifici di origine. Picchi che ha mostrato diverse tendenze in fonti diverse non sarebbero significative nel set misto per la separazione clinica basata su gruppi; caratteristica 1.520 manifestando andamento opposto tra le fonti, è stata scelta da ogni singolo classificatore sorgente (Figura 1A, Tabella 3). Pertanto, essa ha contribuito alla mancanza di riuscita di ogni singolo classificatore fonte d'altra fonte (Tabella 2A). Come previsto, questa funzione non è stata selezionata da qualsiasi modello basato sul set misto. Abbiamo creato un set di dati misti, mentre a caso la rimozione di 21 campioni di cancro allo stomaco dal set di formazione mista, e abbiamo usato questi 21 campioni prelevati per la convalida. Inoltre, abbiamo usato i 12 campioni di controllo libera il cancro raccolti nel nostro laboratorio come un insieme di validazione controllo indipendente. Il modello è stato selezionato secondo una massima precisione predetto secondo una convalida incrociata dieci volte, come prima. Il miglior modello di scoring per il set misto è stato utilizzando (filtro Mann-Whitney p-value di 0,044) 9 caratteristiche e aveva una precisione prevista del 84,1% secondo dieci volte la convalida incrociata del training set. Importante, previsto con precisione 10/12 controlli israeliani. Tuttavia, questo classificatore previsto adeguatamente (13 su 21) dei 21 rimosse campioni di cancro allo stomaco misto utilizzati per la validazione. Quindi, per ridurre l'effetto delle differenze connesse con la fonte a livelli di intensità, le prestazioni del filtro di selezione delle funzioni è stata migliorata con l'introduzione di un passo di normalizzazione quantile. Questa normalizzazione è stata eseguita secondo i controlli di ogni fonte sieri indipendentemente dalle altre fonti (vedi metodi, bioinformatica). Per le caratteristiche, come ad esempio m /z 6431 con una tendenza persistente entrambe le fonti, questo passaggio corretto il bias intensità (Figura 1D). Infatti, 6431 funzione non è stato selezionato per la non-normalizzato classificatore mix-based. Tuttavia, è stato selezionato per il classificatore mix basato normalizzato (Tabella 3). Tuttavia, per le caratteristiche come la m /z 1520 con le tendenze opposte in entrambe le fonti, questa fase potrebbe non cambiare la tendenza, come previsto (Figura 1C). Abbiamo testato l'effetto della normalizzazione quantile applicandolo prima media e selezione delle funzioni. Per meglio valutare l'accuratezza di previsione abbiamo impiegato la misura Matthews coefficiente di correlazione (MCC). MCC è usata in apprendimento automatico come misura della qualità dei binari classificazioni (due classi) e restituisce un valore tra -1 e +1. Un coefficiente di +1 rappresenta una previsione perfetta, 0 una previsione casuale media e -1 una previsione inversa. MCC è generalmente considerata come una misura equilibrata che possono essere usati anche se le classi sono di dimensioni diverse. Abbiamo quindi calcolato la MCC per vari esperimenti di classificazione, al fine di mostrare l'effetto che la normalizzazione ha avuto sulla classificazione. I risultati sono mostrati nella Tabella 2. Si noti che senza normalizzazione, MCC era relativamente elevato per il training set, ma ha prestazioni mediocri sul set di validazione (Tabella 2). Il passo di normalizzazione hanno dato valori elevati MCC simili per la formazione e set di validazione (Tabella 2). Il passo di normalizzazione per controllare polarizzazione incrociata fonte non annullare la necessità per la macchina classificatore di apprendimento basati per definire un modello discriminante; PCA degli insiemi di dati normalizzati due fonti-mista ha portato di nuovo in cattive condizioni di separazione tra i campioni di cancro allo stomaco e di controllo (figura S4). il classificatore ha portato dal set di dati misti, seguendo passo normalizzazione quantile, impiegato 9 caratteristiche (tabella 2). Tre delle 9 funzioni apolipoproteine coinvolti: apoC-III (funzione 9443) e apoC-I (caratteristiche 6431 e 6629, tabella 3). Per verificare ulteriormente i risultati MALDI-based, in primo luogo abbiamo sviluppato un test ELISA per la determinazione qualitativa degli apoC-III nel siero (vedi metodi) e testato tutti i campioni di siero da Asterand e RNTech. I risultati del test ELISA hanno seguito la tendenza dei risultati MALDI (Figura 2A, B); Intensità del apoC-III è risultata significativamente maggiore nei gruppi di controllo rispetto ai gruppi di cancro in entrambe le fonti Sera. Abbiamo analizzati ulteriormente la correlazione tra apoC-III ELISA e 9443 risultati MALDI per ogni campione; ELISA e MALDI risultati hanno mostrato una correlazione significativa (p < 0,0001, di Kendall corse correlazione tau). Abbiamo quindi inviato aliquote sieri da quasi tutti i campioni (stesso stato freeze) a un laboratorio clinico esterna per dosaggio quantitativo immunoturbidity-based per apoC-III [22]. I risultati sono stati ottenuti in mg /dl (Figura 2C) e come sopra, la quantità di apoC-III era significativamente maggiore nei gruppi di controllo di entrambe le fonti Sera. Per verificare i risultati apoC-I MALDI, abbiamo impiegato un commerciale kit ELISA quantitativo, che include norme apoC-I e riconosce entrambi 6431 e 6629 varianti di apoC-I. I risultati sono stati ottenuti in mcg /ml (Figura 3B) e hanno seguito il modello osservato per i risultati MALDI (figure 1D e 3A); Intensità del apoC-I è stato significativamente maggiore nei gruppi di controllo rispetto ai gruppi di cancro in entrambe le fonti Sera. Per valutare la specificità di apoC-I e la riduzione apoC-III nel siero di pazienti affetti da cancro dello stomaco portanti, abbiamo dosato i livelli di apoB-100. I campioni analizzati per apoC-III nel laboratorio clinico esterno sono stati analizzati in parallelo per apoB-100 livelli con dosaggio quantitativo immunoturbidity-based. I risultati sono stati ottenuti in mg /dl (Figura 3C) e non ha mostrato alcuna tendenza significativa tra controllo e stomaco gruppi cancro-cuscinetto. Pertanto, potremmo utilizzare le apoB-100 risultati come un fattore di normalizzazione per l'analisi bioinformatica dei risultati quantitativi apoC-I e apoC-III (Figure 3C, 3B, 2C, rispettivamente). Abbiamo analizzato clinicamente apoC-i, apoC-III e apoB-100 per altri campioni provenienti da pazienti affetti da cancro dello stomaco e controlli cancro-free (fonte RNTech, lo stesso gelo-stato, tra cui 10 pazienti gastrite nei controlli privi di tumore; nota Tabella 1 per il totale numeri campione). Abbiamo anche analizzato clinicamente livelli CA19-9 e CRP per tutti i campioni (stesso freeze-state). Abbiamo poi impiegato software Clementine 10.0 sui campioni RNTech per valutare se le regole set CI sulla base di apoB-100-normalizzato e C-III, CA19-9 e CRP livelli sierici possono essere utilizzati per classificare tra i sieri di cancro allo stomaco di controllo e gruppi di RNTech fonte come fonte di formazione. La combinazione di tutti e 4 i parametri prodotto migliore accuratezza previsione rispetto a combinazione inferiore a 4 parametri (Figura 4 e dati non mostrati). accuratezza previsione del training set è stato 88,4%. Abbiamo impiegato le regole RNTech-ottenute fissati per l'origine e la previsione accuratezza Asterand era 74,4% (Figura 4). Sia per formazione e il riconoscimento della sensibilità era eccellente (87/90 combinato), ma la specificità era meno accurato (37/52 combinato). In questi ultimi anni, un bel paio di rapporti che descrivono biomarcatori sierici MS-identificati /firme per gli stati cancerose sono stati smentiti [5], [18]. Diverse fonti di distorsione sono state descritte compresa la selezione del campione, manipolazione, la trasformazione, la lettura e l'analisi [18], [20], [21]. Dopo la rimozione dei fattori di distorsione che contribuiscono, è stato dimostrato che SELDI-TOF MS tutta siero profiling proteomica con la superficie IMAC non ha rilevato in modo affidabile il cancro alla prostata [23]. Pertanto, gli autori suggeriscono che è improbabile che un approccio di spettrometria di massa utilizzando siero non trasformati sarebbe distinguere tra gli uomini con e senza tumore della prostata [24]. D'altra parte, altri studi MALDI-TOF basati su recenti che evitati fattori di distorsione che contribuiscono e hanno impiegato una tecnica di lavorazione sieri one-step identificato discriminante firme biomarker per diversi tipi di cancro tra cui il cancro alla prostata [11]. In questo studio abbiamo adottato l'approccio di elaborazione sieri un passo per l'identificazione di una firma peptidoma a base di differenziare i sieri derivati da pazienti stomaco adenocarcinoma. Abbiamo fatto uno sforzo ragionevole per evitare distorsioni che contribuiscono fattori precedentemente riportati [18]. Abbiamo analizzato sieri di due biorepositories. Abbiamo osservato che anche nel caso di sieri, l'elaborazione, la lettura e l'analisi MALDI sono la stessa cosa, l'analisi peptidoma è polarizzato dalla biorepository. Oltre alle differenze socio-geografica (Romania e Stati Uniti d'America come la fonte per i campioni, rispettivamente RNTech e Asterand,), la polarizzazione fonte legate potrebbe essere dovuto al marchio del tubo di prelievo di sangue, utilizzato nei diversi biorepositories. Abbiamo poi utilizzato un set campione misto da due fonti Sera per la selezione delle funzioni e aggiunto un passo normalizzazione cross-source per compensare la distorsione fonte. Abbiamo scoperto che (i) l'uso del set di dati mescolato con una Mann-Whitney p-valore soglia per la selezione funzione può scartare funzionalità specifiche di origine, e (ii) una fase di normalizzazione quantile aiuta a selezionare (per apprendimento automatico) caratteristiche parzialmente concordanti , in cui le tendenze sono concordanti tra fonti, ma livelli di intensità sono differenti tra le sorgenti. La necessità di una normalizzazione, quando si tratta di campioni provenienti da diverse fonti, è stato già dimostrato per la tecnologia ad alto rendimento microarray-based [25]. E 'ben noto che le variazioni di procedure sperimentali e le condizioni non controllate (ad es origine socio-geografica di campioni) può portare a pregiudizi di misura sistemici. A seguito delle modifiche, abbiamo stabilito un cross-fonte firma siero peptide per distinguere stomaco i malati di cancro provenienti da controlli non tumorali. Tre dei peptidi corrispondeva a apoC-I e apoC-III. Abbiamo convalidato i nostri risultati MALDI-based con metodi analitici indipendenti che si basano su test immunologici [26]. La firma peptide incluso apoC-III e le caratteristiche apoC-I-derivati. I risultati di quantificazione indipendenti dai loro livelli sierici hanno seguito la tendenza individuata dal approccio MS. Il nostro studio è il primo a segnalare che i livelli sierici di apoC-I e apoC-III possono essere usati come potenziali biomarcatori per lo stomaco cancro. E 'vero che recenti rapporti hanno indicato che i livelli di apolipoproteine' nel sangue potrebbero essere potenziali biomarcatori per diversi tipi di cancro. Ap-I è stato identificato come un potenziale biomarcatore siero per il cancro del colon-retto, il cancro alla prostata ormone-refrattario e fibrosi epatica [27] - [29]. Altri rapporti hanno indicato che apoC-III potrebbe anche essere un potenziale biomarcatore nel cancro del pancreas e della mammella [30], [31]. Tuttavia, tutti questi rapporti impiegato lo screening MALDI-based e non ha verificato i loro risultati con immuno-based o altri test. Né studiano sieri da un'altra fonte come un gruppo di convalida. I nostri risultati dovrebbero essere ulteriormente spesi e convalidati come descritto [32], [33]. Tuttavia, la validazione clinica di apoC-I e apoC-III risultati ci spingono ad esplorare ulteriormente un test diagnostico basato su biomarcatori sierici che possono essere dosati in clinica senza la necessità di una tecnologia MS. Regole set utilizzando apoB-100-normalizzato C-I e C-III, CA19-9 e CRP livelli sierici quantitativi generati per la sorgente RNTech e validati sulla fonte Asterand indipendente avuto accuratezza della stima del 88,4% e 74,4% rispettivamente. Pertanto, l'uso di questi 4 caratteristiche cliniche supera parzialmente il bias di origine.
[10],. Hanno riferito peptidi 61 firme che potrebbero distinguere individui sani da 3 diversi tipi di pazienti affetti da cancro. Mentre tutti questi peptidi e /o loro frammenti sono normalmente presenti nel siero, si osservano differenze di quantità tra individui sani e affetti. Tuttavia, anche se questi risultati dimostrano il potenziale che i profili peptidoma hanno per la diagnosi del cancro, rimane ancora da dimostrare che questo approccio può essere esteso per scoprire marcatori adatti per la diagnosi precoce e il monitoraggio costante. In primo luogo, la capacità di questi biomarcatori sieri peptide di distinguere i pazienti dai controlli è stato per lo più dimostrato per i pazienti con tumori altamente avanzato o metastatico. Inoltre, la robustezza di questi marcatori è stata contestata; variabili incontrollate, per lo più attribuite a differenze di manipolazione dei campioni, i protocolli di elaborazione e analisi dei dati, hanno dimostrato di modificare drasticamente i risultati di questi test [11] - [19]. Mettendo maggiore enfasi sull'acquisizione del campione, manipolazione, la trasformazione, l'elaborazione dei segnali MS e analisi statistiche dei risultati più robusti e riproducibili possono essere raggiunti [18], [20], [21].
Materiali e Metodi
siero campione di trasformazione e preparazione per MS- MALDI
lettura
L'analisi dei dati di MALDI risultati
[21]. Nella seconda fase, l'apprendimento macchina è stata utilizzata per definire un modello discriminante che può essere utilizzato per classificare i pazienti. A tal fine, il processo descritto in Villanueva et al
[21] è stato modificato come descritto di seguito. Il gasdotto modificata si basa interamente su software open source e ulteriori dettagli sono descritti nella sezione bioinformatica in S1 File.
. 9
che dividono i valori scalati nella classe di controllo in 10 quantili.
convalida Immuno-based per le caratteristiche che rappresentano apoC-I e apoC-III
Discussione