Stomach Health > Estomac Santé >  > Stomach Knowledges > estomac article

PLOS ONE: Sérum apolipoprotéines CI et C-III sont réduits dans l'estomac Cancer Patients: Résultats de MALDI-Based peptidome et Immuno-Based Clinical Assays

Résumé

Trouver de nouveaux biomarqueurs peptidiques pour le cancer de l'estomac dans le sérum humain peut être mis en œuvre dans un procédé de prédiction clinique possible pour la surveillance du cancer de l'estomac. Nous avons étudié la peptidome sérique de deux différentes banques de tissus biologiques. Nous avons d'abord utilisé une phase liquide approche de chromatographie en phase C8-inverse pour la purification de l'échantillon, suivie d'une analyse par spectrométrie de masse. Ceux-ci ont été appliquées sur des échantillons de sérum de témoins sans cancer et les patients atteints de cancer de l'estomac à différents stades cliniques. Nous avons ensuite créé un pipeline d'analyse bioinformatique et identifié la signature de peptide discriminer les patients d'adénocarcinome gastrique de témoins sans cancer. Assistée par matrice désorption /ionisation laser-temps de vol (MALDI-TOF) résultats de 103 échantillons a révélé 9 peptides de signature; avec une précision de prédiction de 89% dans l'ensemble de la formation et 88% dans l'ensemble de validation. Trois des peptides discriminants découverts étaient des fragments de apolipoprotéines C-I et C-III (APOC-I et C-III); Nous avons également quantifié les taux sériques, ainsi que CA19-9 et la CRP, en utilisant des essais cliniques commerciaux quantitatifs dans 142 échantillons. résultats quantitatifs ApoC-I et apoC-III en corrélation avec les résultats de la SP. Nous avons ensuite eu recours apoB-100 normalisé des niveaux de CRP apoC-I et apoC-III, CA19-9 et de générer des règles établies pour la prédiction du cancer de l'estomac. Pour la formation, nous avons utilisé des sérums d'un référentiel, et pour la validation, nous avons utilisé des sérums provenant de la deuxième référentiel. exactitudes de prévision de 88,4% et 74,4% ont été obtenus dans la formation et la validation des ensembles, respectivement. les niveaux de l'APOC-I et apoC-III sériques combinés avec d'autres paramètres cliniques peuvent servir de base à la formulation d'un score de diagnostic pour les patients atteints de cancer de l'estomac

Citation:. Cohen M, Yossef R, Erez T, Kugel A, Welt M Karpasas MM, et al. (2011) Sérum apolipoprotéines C-I et C-III sont réduits dans les Patients Cancer de l'estomac: Les résultats de MALDI-Based peptidome et tests cliniques Immuno-Based. PLoS ONE 6 (1): e14540. doi: 10.1371 /journal.pone.0014540

Editeur: Hana Algül, Technische Universität München, Allemagne

reçues: 1 Juillet 2010; Accepté le 22 Novembre 2010; Publié le 18 Janvier, 2011

Droit d'auteur: © 2011 Cohen et al. Ceci est un article en accès libre distribué sous les termes de la licence Creative Commons Attribution, qui permet une utilisation sans restriction, la distribution et la reproduction sur tout support, pourvu que l'auteur et la source originelle sont crédités

Financement:. Le financement était fournie par la Communauté européenne (6e PC GLYFDIS 037661). RNTech SAS France est indiqué comme bailleur de fonds en raison du fait que JT et HB sont /étaient des employés de cette société; les contributions de JT et HB sont définis comme l'approbation finale de la version à publier, et ils ne sont pas impliqués dans la contribution à la conception et la conception, ou l'acquisition de données, ou l'analyse et l'interprétation des données ou de la rédaction du manuscrit. Les bailleurs de fonds ont joué aucun rôle dans la conception de l'étude, la collecte et l'analyse des données, la décision de publier, ou de la préparation du manuscrit

Intérêts concurrents:. Le fait que deux employés anciens ou actuels de RNTech SAS France sont les auteurs de ce manuscrit ne modifie pas l'adhésion à tous les PLoS ONE politiques sur le partage des données et du matériel tel que détaillé dans le guide en ligne pour les auteurs.

introduction

taux de nombreux cancers de la mortalité n'a pas changé de façon spectaculaire dans le 20 dernières années [1]. La détection précoce a été montré pour améliorer considérablement l'efficacité du traitement du cancer, mais la détection est souvent que possible après l'apparition des premiers symptômes cliniques, ce qui, dans certains cancers se produit trop tard pour une intervention réussie. Ceci est largement dû à l'absence de tests spécifiques et sensibles qui permettent le dépistage et le suivi des états cancéreux précoce. Par conséquent, la découverte de nouveaux biomarqueurs de tumeur est de plus en plus considérée comme essentielle pour améliorer le traitement du cancer. Dans la dernière décennie, de nombreuses études ont mis l'accent sur la découverte de biomarqueurs. L'une des sources les plus prometteuses pour la découverte de biomarqueurs est le sang humain, en particulier le sérum ou le plasma, ce qui peut refléter de nombreux événements dans le corps, en temps réel. Pourtant, malgré d'immenses efforts, seul un très petit nombre de protéines plasmatiques ont été prouvé qu'ils ont une valeur diagnostique [2] - [5]. Souvent, ces biomarqueurs ne sont pas seuls et sont accompagnés par d'autres tests pour la surveillance et le diagnostic. La plupart d'entre eux ne sont pas spécifiques et assez sensible pour le diagnostic large écran [6], [7].

Une source possible de nouveaux biomarqueurs du cancer est le peptidome. La raison d'être en se concentrant sur les peptides de sérum est basée sur des preuves que la formation du cancer et le développement implique un changement dans le métabolisme des protéines et des peptides ', ainsi que sur la disponibilité accrue de la méthodologie pour le criblage de l'ensemble peptidome. En termes de développement du cancer, des changements peuvent se produire dans le réseau de peptides intra- et extra-cellulaires représentés dans le peptidome de sang, qui peuvent être spécifiques au stade cancéreux, et ont donc un potentiel de diagnostic [2], [4], [ ,,,0],5]. En termes de technologie de détection, les progrès récents dans la technologie MS permettent la détection de centaines de peptides de quelques microlitres de sérum [8], [9]. En effet, les études de peptidome de sang précédentes ont rapporté une série de peptides de signature dans le sérum qui avait distingué en bonne santé de patients atteints de cancer (revue dans [5]). Cela a été montré pour la prostate, de la vessie, du sein et le cancer de la thyroïde par Villanueva et al
[10], [11]. Ils ont rapporté des peptides 61 de signature qui pourrait distinguer les individus en bonne santé à partir de 3 types de patients atteints de cancer différents. Bien que tous ces peptides et /ou leurs fragments sont normalement présents dans le sérum, les différences de quantité entre les individus sains et atteints sont observées. Cependant, bien que ces résultats démontrent le potentiel que les profils de peptidome ont pour le diagnostic du cancer, il reste encore à démontrer que cette approche peut être étendue à la découverte des biomarqueurs appropriés pour le diagnostic précoce et un suivi cohérent. En premier lieu, la capacité de ces marqueurs biologiques des sérums de peptides pour distinguer les patients de contrôle a été démontrée pour la plupart des patients atteints de tumeurs très avancé ou métastatique. En outre, la robustesse de ces biomarqueurs a été contestée; des variables non contrôlées, principalement attribuables à des différences de traitement des échantillons, les protocoles de traitement et d'analyse des données, se sont révélés modifier considérablement les résultats de ces tests [11] - [19]. En mettant l'accent majeur sur l'acquisition de l'échantillon, la manipulation, le traitement, MS traitement du signal et des analyses statistiques des résultats plus robustes et reproductibles peuvent être atteints [18], [20], [21].

Dans ce travail, nous nous sommes concentrés sur la découverte d'un réseau de peptides de signature qui pourraient avoir une valeur diagnostique pour le cancer de l'estomac. Pour ce faire, nous avons utilisé trois sources de sérum différents impliquant des patients atteints de cancer de l'estomac à différents stades. Un protocole strict pour la collecte et le traitement du sérum a été appliqué [18], en utilisant une procédure cohérente d'extraction des peptides et des lectures MALDI-TOF, avec un pipeline d'analyse modifiée. Ensemble, la canalisation améliorée a permis l'identification d'un motif de peptide qui discrimine entre les échantillons de cancer et de contrôle. Ces résultats ont été corroborés sur les sérums d'origine et nouveau pour trois caractéristiques identifiées du modèle, apoC-I (deux fonctions) et apoC-III, en utilisant des dosages immuno-basés. Nous avons ensuite eu recours les taux sériques de l'APOC-I et apoC-III combinée avec CRP et CA19-9 marqueurs pour discriminer les patients d'adénocarcinome gastrique de témoins sans cancer.

Serum la récolte de matériaux et méthodes et manipulation

sérums ont été obtenus à partir de deux sources commerciales. 79 échantillons de sérum de patients atteints de cancer de l'estomac avant l'intervention et 33 échantillons de sérum de témoins appariés sans cancer (y compris les 10 patients atteints de gastrite) ont été recueillis par RNTech (Paris, France) en Roumanie. forme Sera le cancer et les patients cancéreux non ont été prises après une nuit de jeûne de la manière suivante: 5 ml de sang a été prélevé dans un tube de sérum VACUETTE (CatLj005, Greiner Bio One, Kremsmuenster, Autriche) et laissé à coaguler pendant environ 30 minutes, après quoi, le tube a été centrifugé à 3000 tpm dans une centrifugeuse Hettich EBA 20S (Ag Hettich, Tuttlingen, Allemagne) pendant 5 minutes à température ambiante. Le sérum séparé a été aliquote dans aliquots de 1 ml dans des tubes cryogéniques stériles (Nalgene, Rochester, NY, USA) et immédiatement congelé à (-70) ° C. 22 pré-opération sérums de cancer de l'estomac et 21 contrôles ont été recueillis par Asterand aux Etats-Unis (Detroit, MI, USA) de la manière suivante: 10 ml de sang a été prélevé dans un SST vacutainer, plus tube en plastique BD (cat #BEC 367985, BD , San Jose, CA, USA). Le tube a été mélangé par inversion de 5 fois et on le laisse coaguler pendant environ 30 minutes dans une position verticale. Cette étape a été suivie d'une centrifugation de 1,100-1,300 g pendant 10 minutes à température ambiante. Le sérum séparé a été aliquote dans aliquots de 1 ml dans des tubes cryogéniques stériles (Nalgene) tubes et immédiatement congelé à (-70) ° C. Pour la source Asterand, les données à jeun n'a pas été recueilli sur tout le sang attire dans leur banque. échantillons de sérums des deux sociétés ont été transportés sur de la glace sèche et conservés à (-70) ° C immédiatement après leur arrivée. échantillons de sérums ont été décongelés sur de la glace pendant environ une heure et demie, 50 ul a été aliquote dans des tubes lo-bind (Eppendorf, Hambourg, Allemagne) et immédiatement ré-congelés à (-70) ° C. Tous les aliquotes échantillons ont été conservés à (-70) ° C jusqu'à ce que le traitement. Une troisième source de sérums ont été obtenus dans notre laboratoire à partir de 12 contrôles israéliens sans cancer. Le sang a été dessiné avec la marque de tube utilisé par RNTech (CatLj005, Greiner Bio One) et la manipulation de sérum suivi la procédure de RNTech. Les sérums obtenus dans notre laboratoire ont été prélevés sur les individus non-jeûne. Les deux sociétés RNTech et Asterand ont établi et mené leurs activités selon les normes réglementaires et éthiques, la mise en œuvre locale, nationale, européenne, américaine et internationale des règles et recommandations (ONU), en particulier lorsqu'elle est applicable à la collecte de matériel biologique et le traitement et l'exploitation des résultats de recherche. Cela inclut à la fois le consentement écrit de chaque contribuant patient à la banque biologique et les données, et l'autorisation d'étude écrite du comité d'éthique de chaque institut clinique contribuant échantillons aux banques des entreprises.

traitement des échantillons de sérum et de préparation pour MS- MALDI
lecture

Chaque échantillon de sérum a été traité dans deux à trois répétitions (de aliquots identiques et à des dates aléatoires séparées). Les peptides ont été extraits sur des billes revêtues d'C8, lavés, élues, mélangé avec la matrice CHCA, et déposées sur la plaque cible MALDI. Les sérums ont été traitées en répétitions et déposé sur la plaque MALDI en double. Pour une description détaillée s'il vous plaît voir S1 Fichier.

L'analyse des données de MALDI résultats

Le traitement des données a été réalisée en deux étapes. Dans la première étape, une matrice d'intensité a été réalisée à partir des fichiers ASCII brutes des lectures MALDI-TOF de toutes les sources d'échantillons de sérum en utilisant de ré-échantillonnage, d'alignement, et la détection de m /z pics comme décrit dans Villanueva et al
[21]. Dans la deuxième étape, l'apprentissage machine a été utilisée pour définir un motif discriminante qui peut être utilisé pour classer les patients. A cet effet, le procédé décrit dans Villanueva
et al [21] a été modifié comme décrit ci-dessous. Le pipeline modifié repose entièrement sur des logiciels open source et des détails supplémentaires sont décrits dans la section de la bioinformatique au S1 Fichier.

(1) Une sommation répliquée et disposent pas de filtres ont été ajoutés à considérer les valeurs nulles comme des cas particuliers. Notre matrice initiale contenait une quantité considérable de valeurs nulles pour les différentes fonctions dans différents échantillons. En raison de la limitation générale de la technologie MALDI, une fraction significative de ces valeurs nulles pourrait représenter des valeurs manquantes plutôt que de véritables zéro intensités. Pour surmonter partiellement cette limitation, nous lisons chaque échantillon dans les répétitions, et calculé l'intensité moyenne, en ignorant zéro lectures d'intensité. Suite à cette sommation répliquée, la matrice entraîné contenait encore quantité substantielle de valeurs nulles. les modèles à base de SVM pourraient classer selon les valeurs zéro représentant des valeurs manquantes et pas de vrais zéro intensités. Par conséquent, nous avons séparé par filtration les caractéristiques qui avaient encore des valeurs nulles dans au moins l'un des échantillons. Aucune de ces fonctionnalités supprimées avait une nette préférence des valeurs nulles à une affectation clinique spécifique du groupe. La sous-matrice résultante a été utilisée dans une machine de classification d'apprentissage.

(2) Une nouvelle approche de la fonction de sélection paramétrisation a été développé. Les définitions pour l'analyse à base de SVM ont d'abord été comme suit: RNTech estomac vs contrôle RNTech, Asterand estomac vs contrôle Asterand. Mann-Whitney p-valeur a été calculée pour chaque pic, en fonction des groupes cliniques définis pour l'analyse. Nous avons ensuite utilisé Mann-Whitney valeurs p et les intensités de pointe comme seuils pour sélectionner un sous-ensemble de caractéristiques (pics) pour une utilisation dans des expériences d'apprentissage de la machine. Une coupure d'intensité n'a pas filtrer les échantillons dans lesquels au moins une lecture moyenne avait une intensité au-dessus du seuil pour le pic testé. Valeurs de filtrage ont été optimisés pour une meilleure performance dans les classificateurs basés sur SVM (produit par LIBSVM, noyau linéaire) en fonction de dix fois la validation croisée par un protocole en deux étapes. La première étape définie plages de recherche et les intervalles pour les deux filtres et itérer sur toutes les combinaisons. Ensuite, la deuxième étape a choisi la combinaison de valeurs, qui ont fourni les meilleures performances et plus petit nombre de caractéristiques.

(3) Une étape de normalisation a été ajouté pour contrôler les contre-exemples et de contre-expérience biais. Pour la comparaison et la sélection des caractéristiques montrant des tendances similaires dans les deux sources sources de sérums, cross-source de normalisation des intensités a été réalisée en utilisant la fonction de R "quantile" pour définir 9 seuils X 1
. 9
qui divisent les valeurs mises à l'échelle de la classe de contrôle en 10 quantiles.

méthodes bioinformatiques supplémentaires sont fournies dans S1 fichier.

tests commerciaux et cliniques sur la base Immuno-pour le

ApoC-III et apoB-100 niveaux de différentes apolipoprotéines ont été mesurés par Immunoturbidometry sur un Olympus 400 autoanalyseur, en utilisant les kits K-dosage (cat # KAI-006 et 6142, Kamiya Biomedical, Seattle, WA, USA) comme décrit précédemment [22]. Dans la maison ELISA pour apoC-III est décrite dans S1 Fichier. niveaux ApoC-I ont été testés à l'aide d'un kit AssayMax humain apolipoprotéine C-I ELISA (Assaypro, St. Charles, MO, USA) selon les instructions du fabricant. normes purifiées apoC-I humains ont été inclus dans le kit.

Résultats

Utilisation de la méthode à base de MS pour identifier des peptides de sérum signature pour le cancer de l'estomac

Des études antérieures ont montré que bien peptidomique sérums -Conçu et soigneusement contrôlées peuvent séparer les patients cancéreux porteurs spécifiques et des contrôles non cancéreux basés sur des motifs distinctifs de peptides de signature dans le sérum [10], [11]. Nous avons examiné si ces résultats ne peuvent être reproduits pour un cancer de l'estomac, et si cette séparation est suffisante pour l'analyse de sérums provenant de différentes sources. Nous avons d'abord analysé les profils de peptides de sérum de 62 patients atteints de cancer de l'estomac à différentes étapes, ainsi que des sérums de contrôle de 41 volontaires sains. Ces sérums ont été obtenus à partir de deux sources: (i) RNTech, une entreprise qui a recueilli des sérums à Bucarest, Roumanie; et (ii) Asterand, une entreprise qui a recueilli des sérums aux Etats-Unis. Pour chaque source, les sérums ont été recueillies à l'aide d'un seul protocole clinique standard. Les protocoles étaient comparables par exemple le type du tube, le temps de coagulation et la congélation initiale du sérum (voir Méthodes), mais les tubes de prélèvement de sang étaient différents. Répartition par âge, le sexe et les caractéristiques cliniques des 103 individus inclus dans cette étude sont présentés dans le tableau 1 et plus en détail dans S1 Fichier. Un résumé des stades cliniques de sérum du cancer dérivé estomac pour les deux sources est donnée dans le tableau 1. traitement de l'échantillon après la collecte initiale était uniforme, comportant 2 cycles de congélation-décongélation pour réaliser le stockage initial et aliquotage subséquente pour l'extraction des peptides et analyse par MS. Tous les 103 échantillons de sérum ont été traitées manuellement, mais en utilisant de façon identique à une étape d'extraction en phase inverse. échantillons de sérums et répétitions échantillons ont été traités et lus au hasard à des dates différentes pour éviter les biais de la date associée à la préparation. Toute la préparation de sérums et le dépôt a été effectué par la même personne. De même, toutes les lectures MALDI ont été effectuées par le même technicien. La sensibilité de l'instrument MALDI-TOF a été contrôlée régulièrement et constamment étalonné pendant toutes les lectures.

Analyse des peptidome de sérums à base de MS a révélé une signature 9-peptide qui distinguent les patients d'adénocarcinome gastrique de contrôles gratuits de cancer

total de 637 pics de masse (caractéristiques) ont été identifiés dans les 103 échantillons étudiés. Les résultats de l'MALDI ont été converties en une matrice contenant les intensités de signal de 637 pics de masse (caractéristiques) pour chacun des échantillons de sérum étudiés avec répétitions pour chaque échantillon (voir les méthodes, la bio-informatique). Bien que la classification hiérarchique sans surveillance en utilisant toutes les fonctionnalités ne séparer cancéreuses et non cancéreuses échantillons, l'analyse PCA de toutes les caractéristiques pour chaque source de sérums différenciés entre le cancer et les échantillons non-cancéreux (figures S1-S3). Cela suggère que la filtration et la sélection caractéristique est essentielle avant d'employer la classification basée sur l'apprentissage machine. Par conséquent, nous (i) appliqué une étape de filtration et de sélection fonction et (ii) employions Mann-Whitney valeurs p et intensités des pics comme seuils pour sélectionner un sous-ensemble de caractéristiques (pics) pour une utilisation dans des expériences d'apprentissage de la machine. (Voir les méthodes, la bio-informatique). Nous avons analysé puis au sein de chaque source (RNTech et Asterand) si les sérums des patients et des contrôles pourrait être séparés. Nous avons reçu de bons résultats pour chacun des classificateurs de source unique; classificateurs à base de SVM pour RNTech et Asterand avaient 90,0% et 93,0% ont prédit exactitudes, respectivement, selon dix fois la validation croisée de l'ensemble de la formation (tableau 2A). réarrangement aléatoire des membres du groupe a donné lieu à des p-valeurs beaucoup plus élevées (par exemple 0,8) et une faible précision prédite dans les modèles formés par chaque source de sérums. Cela indique l'importance des conditions cliniques pour la classification en deux groupes cliniquement définis au sein de chaque source de sérums. Cependant, les classificateurs de source unique ne fonctionnent pas bien sur les échantillons de l'autre source, de prédire l'état clinique correctement que dans 35/60 échantillons (Asterand sur RNTech) et 25/43 (RNTech sur Asterand) (tableau 2A). Par conséquent, le biais de source de peptidome a un effet significatif sur la précision de la prédiction.

L'incapacité des modèles formés sur une seule source de prédire de manière adéquate les conditions cliniques de lectures de l'autre source (tableau 2A) est mieux présenté lors de la vérification les entités sélectionnées par les classificateurs spécifiques à la source (tableau 3). Certaines des caractéristiques qui a bien fonctionné sur une seule source a montré une tendance inverse sur l'autre source. D'autres étaient importants pour le classement dans une seule source, mais avait peu ou pas d'effet dans l'autre. Ces observations nous ont conduit à une analyse comparative des données provenant des deux sources. Nous avons produit des boîtes à moustaches pour toutes les intensités de pointe, selon les groupes cliniques. Ces parcelles ont montré que lorsque l'on compare les intensités de contrôle et de cancer pour chaque fonction dans une source, la tendance observée pourrait différer entre les deux sources (par exemple m /z 1520, figure 1A). Même lorsque la tendance persistait dans les deux sources, les valeurs d'intensité peuvent être différentes (par exemple m /z 6431; RNTech supérieur à celui Asterand, figure 1B). Afin de créer un modèle de prédiction, nous avions besoin de (i) défausse source spécifiques phénomènes, et (ii) d'ajouter une étape de normalisation qui permettrait de réduire l'effet de différents niveaux d'intensité où la tendance a été maintenue.

Le l'utilisation de l'ensemble de données mixtes avec une coupure p-valeur de Mann-Whitney pour la sélection des fonctionnalités pourraient éliminer les phénomènes spécifiques à la source. Peaks qui ont montré des tendances différentes sources ne seraient pas significatifs dans l'ensemble mixte pour la séparation à base de groupe clinique; caractéristique 1520 manifestant une tendance inverse entre les sources, a été choisi par chaque classificateur de source unique (figure 1A, tableau 3). Par conséquent, il a contribué au manque de bonne exécution de chaque classificateur source unique sur l'autre source (tableau 2A). Comme prévu, cette fonction n'a pas été sélectionnée par un modèle basé sur l'ensemble mixte. Nous avons créé un ensemble tout en enlevant au hasard 21 échantillons de cancer de l'estomac de l'ensemble de la formation mixte données mixtes, et utilisé ces 21 échantillons prélevés pour la validation. En outre, nous avons utilisé les 12 échantillons témoins sans cancer recueillies dans notre laboratoire comme un ensemble de validation de contrôle indépendant. Le modèle a été sélectionné en accord avec un maximum de précision prédite en fonction d'une validation croisée dix fois, comme précédemment. Le meilleur modèle de notation pour l'ensemble mixte était en utilisant (filtre Mann-Whitney valeur p de 0,044) 9 caractéristiques et avait une précision prédite de 84,1% selon dix fois la validation croisée de l'ensemble de la formation. Surtout, il a prédit avec précision 10/12 contrôles israéliens. Cependant, ce classificateur prédit mal (13 de 21) les 21 échantillons de cancer de l'estomac mixte enlevés utilisés pour la validation.

Par conséquent, pour réduire l'effet des différences liées à la source dans les niveaux d'intensité, la performance du filtre dans la sélection des fonctionnalités est renforcée par l'introduction d'une étape de normalisation quantile. Cette normalisation a été réalisée selon les contrôles de chaque source indépendamment des autres sources de sérums (voir les méthodes, la bio-informatique). Pour connaître les caractéristiques, telles que m /z 6431 avec une tendance persistante dans les deux sources, cette étape a corrigé le biais d'intensité (figure 1D). En effet, 6431 fonctionnalité n'a pas été sélectionné pour le classificateur à base de mélange non-normalisé. Cependant, il a été sélectionné pour le classificateur à base de mélange normalisé (tableau 3). Pourtant, pour des fonctionnalités telles que m /z 1520 avec des tendances opposées dans les deux sources, cette étape ne pouvait pas changer la tendance, comme prévu (figure 1C).

Nous avons testé l'effet de la normalisation quantile en appliquant avant la moyenne et sélection de fonctionnalité. Afin de mieux évaluer la précision de la prédiction, nous avons employé la mesure Matthews Coefficient de corrélation (MCC). MCC est utilisé dans l'apprentissage de la machine en tant que mesure de la qualité des binaires (deux classes) classifications et renvoie une valeur comprise entre -1 et +1. Un coefficient de +1 représente une prédiction parfaite, 0 une prédiction aléatoire moyen et -1 une prédiction inverse. MCC est généralement considérée comme une mesure équilibrée qui peut être utilisé même si les classes sont de tailles différentes. Nous avons donc calculé la MCC pour diverses expériences de classification afin de montrer l'effet que la normalisation avait sur la classification. Les résultats sont présentés dans le tableau 2. Notez que sans normalisation, MCC était relativement élevé pour l'ensemble de la formation, mais a montré des performances médiocres sur l'ensemble de validation (tableau 2). L'étape de normalisation a donné des valeurs élevées similaires MCC pour la formation et des ensembles de validation (tableau 2). L'étape de normalisation pour contrôler le biais croix source n'a pas annulé la nécessité pour la machine classificateur basé sur l'apprentissage pour définir un motif discriminatoire; PCA des ensembles de données normalisées deux sources mixtes a entraîné à nouveau dans une mauvaise séparation entre les échantillons de cancer de l'estomac et de contrôle (Figure S4).

validation basée Immuno-pour les fonctions représentant apoC-I et apoC-III

le classificateur résulte de l'ensemble de données mixtes, après l'étape de normalisation quantile, employait 9 caractéristiques (tableau 2). Trois des caractéristiques 9 apolipoprotéines impliquées: apoC-III (option 9443) et apoC-I (caractéristiques 6431 et 6629, tableau 3). Pour vérifier davantage les résultats en fonction MALDI, nous avons d'abord mis au point un test ELISA pour la détection qualitative de l'APOC-III dans le sérum (voir méthodes) et testé tous les échantillons de sérum de Asterand et RNTech. Les résultats de l'ELISA ont suivi la tendance des résultats MALDI (Figure 2A, B); L'intensité de l'apoC-III était significativement plus élevée dans les groupes témoins par rapport à des groupes de cancer dans les deux sources de sérums. Nous avons en outre dosé la corrélation entre apoC-III ELISA et 9443 résultats MALDI par chaque échantillon; les résultats ELISA et MALDI ont montré une corrélation significative (p < 0,0001 ran corrélation tau de Kendall). Nous avons ensuite envoyé aliquotes de sérum de presque tous les échantillons (même de l'état de gel) à un laboratoire clinique externe pour le dosage quantitatif basé immunoturbidity-pour apoC-III [22]. Les résultats ont été obtenus en mg /dl (figure 2C) et comme ci-dessus, la quantité de l'APOC-III était significativement plus élevée dans les groupes témoins des deux sources de sérum.

Pour vérifier les résultats apoC-I MALDI, nous avons utilisé une publicité kit ELISA quantitative qui comprend des normes apoC-I et reconnaît à la fois 6431 et 6629 variantes de l'aPOC-I. Les résultats ont été obtenus en pg /ml (figure 3B) et ont suivi la tendance observée pour les résultats MALDI (figures 1D et 3A); L'intensité de l'apoC-I était significativement plus élevée dans les groupes témoins par rapport à des groupes de cancer dans les deux sources de sérums. Pour évaluer la spécificité de l'APOC-I et la réduction des apolipoprotéines-III dans les sérums de patients estomac cancer portant, nous avons dosé les niveaux de l'ApoB-100. Les échantillons analysés pour apoC-III dans le laboratoire clinique externe ont été testés en parallèle pour apoB-100 niveaux en utilisant un dosage quantitatif basé immunoturbidity. On a obtenu les résultats en mg /dl (figure 3C) et ont montré aucune tendance significative entre les groupes de cancer portant contrôle et de l'estomac. Par conséquent, nous pourrions utiliser les apoB-100 résultats en tant que facteur de normalisation pour l'analyse bioinformatique des résultats quantitatifs apoC-I et apoC-III (Figures 3C, 3B, 2C, respectivement).

Nous avons analysé cliniquement apoC-I, apoC-III et apoB-100 pour les échantillons supplémentaires provenant de patients atteints de cancer de l'estomac et des contrôles sans cancer (source de RNTech, même état-gel, dont 10 patients atteints de gastrite dans les contrôles sans cancer; la note Tableau 1 pour le total nombre d'échantillons). Nous avons également analysé CA19-9 et CRP cliniquement niveaux pour tous les échantillons (même de l'Etat-gel). Nous avons ensuite eu recours Clementine logiciel 10.0 sur les échantillons RNTech pour évaluer si les taux sériques règles établies CI basé sur apoB-100-normalisé et C-III, CA19-9 et CRP peuvent être utilisés pour classer entre les sérums des groupes de RNTech contrôle et cancer de l'estomac source en tant que source d'entraînement. La combinaison de tous les 4 paramètres a abouti à une meilleure précision de la prédiction par rapport à la combinaison inférieure à 4 paramètres (figure 4 et données non présentées). la précision de la prévision de l'ensemble de la formation était de 88,4%. Nous avons utilisé les règles RNTech obtenus fixés pour la source et la prédiction de précision Asterand était de 74,4% (Figure 4). Pour la formation et la validation de la sensibilité était excellent (87/90 combiné) mais la spécificité était moins précis (37/52 combiné).

Discussion

Au cours des dernières années, quelques rapports assez décrivant biomarqueurs sériques MS-identifiés /signatures pour des états cancéreux ont été révélées fausses [5], [18]. Différentes sources de biais ont été décrites, y compris la sélection de l'échantillon, la manipulation, le traitement, la lecture et l'analyse [18], [20], [21]. Lors de l'élimination des facteurs de polarisation contributeurs, il a été montré que la technique SELDI-TOF MS sérum entier profil protéomique avec la surface IMAC n'a pas détecté de façon fiable le cancer de la prostate [23]. Par conséquent, les auteurs suggèrent qu'il est peu probable qu'une approche de la spectrométrie de masse en utilisant du sérum non traité serait la différence entre les hommes avec et sans cancer de la prostate [24]. D'autre part, d'autres études récentes basées sur MALDI-TOF qui ont évité les facteurs de polarisation contributeurs et a employé une technique de traitement de sérums à une étape identifiée discriminer les signatures de biomarqueurs pour différents cancers, dont le cancer de la prostate [11].

Dans ce étude, nous avons adopté l'approche d'une étape de traitement de sérums pour l'identification d'une signature basée peptidome à différencier les sérums provenant de patients atteints d'un adénocarcinome de l'estomac. Nous avons fait un effort raisonnable pour éviter précédemment déclarés biais des facteurs contributifs [18]. Nous avons analysé les sérums provenant de deux banques de tissus biologiques. Nous avons observé que, même lorsque le traitement des sérums, le traitement et l'analyse MALDI lecture sont les mêmes, l'analyse de peptidome est sollicité par le biodépôt. En plus des différences socio-géographique (Roumanie et Etats-Unis en tant que source pour les échantillons en RNTech et Asterand, respectivement), le biais liée à la source pourrait être due à la marque du tube de prélèvement de sang, utilisé dans les différentes banques de tissus biologiques.

Nous avons ensuite utilisé un ensemble d'échantillons mélangés à partir de deux sources de sérums pour la sélection des fonctionnalités et ajouté une normalisation étape cross-source pour compenser le biais de la source. Nous avons constaté que (i) l'utilisation de l'ensemble de données mixtes avec une p-valeur de coupure de Mann-Whitney pour la sélection des fonctionnalités pourraient jeter caractéristiques spécifiques à la source, et (ii) une étape de normalisation quantile aide à sélectionner (pour l'apprentissage de la machine) caractéristiques partiellement concordante dans lequel les tendances sont concordantes entre les sources, mais les niveaux d'intensité sont différentes entre les sources. La nécessité d'une normalisation, lorsqu'ils traitent avec des échantillons provenant de différentes sources, a déjà été montré pour la technologie à haut débit à base de microréseaux [25]. Il est bien établi que les variations dans les procédures expérimentales et des conditions non contrôlées (origine par exemple socio-géographique des échantillons) peut conduire à des biais systémiques de mesure.

A la suite des modifications, nous avons établi une signature peptidique de sérum contre-source pour distinguer l'estomac patients atteints de cancer de contrôles non-cancéreuses. Trois des peptides correspondait à APOC-I et apoC-III. Nous avons validé nos résultats en fonction MALDI-avec des méthodes analytiques indépendants qui sont basés sur des immunoessais [26]. La signature de peptide inclus apoC-III et les caractéristiques apoC-I-dérivés. Les résultats de la quantification indépendante de leurs taux sériques ont suivi la tendance identifiée par l'approche de MS.

Notre étude est la première à signaler que les niveaux de l'APOC-I et apoC-III sérum peut être utilisé comme biomarqueurs potentiels pour l'estomac cancer. Il est vrai que les rapports récents ont indiqué que les niveaux de apolipoprotéines dans le sang pourraient être des biomarqueurs potentiels pour différents cancers. ApoC-I a été identifié comme un marqueur biologique sérique potentiel pour le cancer colorectal, le cancer de la prostate hormono-réfractaire et la fibrose du foie [27] - [29]. D'autres rapports indiquent que l'APOC-III pourrait aussi être un biomarqueur potentiel dans le cancer du pancréas et le cancer du sein [30], [31]. Cependant, tous ces rapports employés dépistage-MALDI et n'a pas vérifié leurs résultats avec des analyses basées sur immunodéprimés ou autres. n'a pas non plus qu'ils étudient les sérums provenant d'une autre source en tant que groupe de validation.

Nos résultats devraient encore être dépensés et validés comme décrit [32], [33]. Pourtant, la validation clinique de l'APOC-I et apoC-III résultats nous incitent à explorer davantage un test de diagnostic basé sur les biomarqueurs sériques qui pourraient être dosés dans la clinique sans avoir besoin de la technologie MS. Règles établies en utilisant apoB-100 normalisé les taux sériques quantitatifs générés pour la source RNTech et validées sur la source Asterand indépendante avait une précision de prédiction de 88,4% et 74,4%, respectivement C-I et C-III, CA19-9 et CRP. Par conséquent, l'utilisation de ces 4 caractéristiques cliniques surmonte partiellement la polarisation de la source.

Other Languages