I den första studien med den nydekontaminerade datamängden, forskarna har redan upptäckt att normala och cancerösa organvävnader har en något annorlunda mikrobiotkomposition, att bakterier från dessa sjuka platser kan komma in i blodomloppet, och att denna bakteriella information kan hjälpa till att diagnostisera cancer och förutsäga patientresultat.
Resultaten visas online den 30 december i tidningen Cellvärd och mikrobe .
TCGA är ett landmark -cancergenomprogram som molekylärt karakteriserade över 20, 000 primärcancer och matchade friska prover som sträcker sig över 33 cancertyper. Den har producerat mer än 2,5 miljoner gigabyte "omic" data. Atlasen innehåller vilket DNA som finns, vilka epigenetiska markörer finns på DNA:t, vilket DNA slås på och vilka proteiner som produceras. Det är fritt tillgängligt för allmänt bruk.
En studie från atlasdata avslöjade ett överflöd av Fusobacterium nucleatum vid kolorektal cancer, som sedan har visat sig vara vägledande för scen, överlevnad, metastaser och till och med läkemedelssvar av denna typ av cancer. Många fler studier har sökt efter sådana bakteriella biomarkörer, men få har upptäckts. En stor anledning till detta är kontaminering.
När bakterier av misstag införs i proverna av laboratorierna, det blir svårt att urskilja vilka arter som faktiskt fanns i proverna till att börja med. Även om liknande mikrobiomstudier med mikroberikt material som avföring kan övervinna små mängder kontaminering, de relativt små prover som tagits från levande mänskliga organ och tumörprover kan inte.
När man undersöker en delmängd av TCGA -sekvenseringsdata, tidigare analyser visade att mikrobiellt DNA från ett antal arter var resultatet av laboratoriekontaminering.
Alla mikrobiotatstudier plågas av tanken att om du hittar en mikrobe, var det verkligen i vävnaden eller infördes det kontaminering under behandlingen? Vi har uppfunnit en metod som kan extrahera de mikrober som verkligen fanns i varje prov och använde den för att bygga det vi har kallat The Cancer Microbiome Atlas, vilket kommer att vara en enorm resurs för samhället och låta oss förstå hur cancer förändrar ett organs mikrobiom. "
Xiling Shen, Hawkins Family Docent i biomedicinsk teknik vid Duke
Metoden för att ta bort kontaminering från TCGA -data uppfanns av Anders Dohlman, en doktorand i Shens laboratorium. Dohlman jämförde först mikrobiomsignaturerna mellan cancervävnader från olika organ och blod, och utesluter förorenande arter som dök upp utan åtskillnad. Han jämförde sedan mikrobiomsignaturerna för identiska prover som bearbetades på separata platser, allt från Harvard till Baylor. Dohlman drog slutsatsen att de mikrobiella arter som bara kan detekteras från en specifik plats skulle vara föroreningarna, så att han kan tilldela en unik kontamineringssignatur för varje webbplats.
"En stor utmaning i denna process var arter med blandade bevis, som är bakterier som är både förorenande och endogena för vävnaden, "sa Dohlman." Men eftersom TCGA har så många olika typer av data, vi kunde reta det. Big data hjälper verkligen! "
Ansträngningen ger redan utdelning på olika sätt. Efter att ha använt Dohlmans dekontamineringsalgoritm, forskarna tog en närmare titt på mikrobiotasignaturerna på prover tagna från kolorektala cancerpatienter. De upptäckte två unika grupper av bakterier som ofta finns tillsammans, varav en verkar vara associerad med patientens överlevnad.
Forskarna upptäckte också att vissa cancerformer verkligen förändrar mikrobiomet i deras hemvistorgan. Det kan vara, Shen skäl, att tumörer förändrar ett organs mikromiljö, vilket gör det mer eller mindre gästvänligt för olika mikrobiella arter. Och genom att leta efter mikrobiella signaturer i patientblodprover, de fann också att trots konventionell visdom till det motsatta, vissa bakterier tar sig in i blodomloppet, vilket också kan ge en indikation på en cancers framsteg.
"Det har varit en slags kris på området om huruvida högprofilerade papper kan reproduceras eller inte, på grund av utmaningen med kontaminering, "sa Shen." Till exempel, medan ett centrum skulle kunna återge sina resultat, ett annat centrum skulle inte. Detta förklarar varför:Varje centrum har sin egen mycket konsekventa partiskhet. (Dess egna bosatta mikrobföroreningar.) I framtiden kommer nya studier kan använda vår metod för att ta bort denna fördom och återge resultat, och forskningscentrum kan kanske använda sin partiskhet vi har identifierat för att mildra deras kontaminering. "