Stomach Health > magen Hälsa >  > Q and A > magen fråga

UniFrac mikrobiomverktyg optimerat för dator -GPU:er

Forskare vid San Diego Supercomputer Center (SDSC) vid University of California San Diego har tillämpat sin högpresterande datakunskap genom att överföra det populära UniFrac mikrobiomverktyget till grafiska processorenheter (GPU:er) i ett försök att öka accelerationen och noggrannheten hos vetenskaplig upptäckt, inklusive brådskande COVID-19-forskning.

Våra initiala resultat överträffade våra mest optimistiska förväntningar. Som ett test valde vi en beräkningsmässig utmaning som vi tidigare mätte som krävde cirka 900 timmars tid med hjälp av serverklassprocessorer, eller cirka 13, 000 CPU -kärntimmar. Vi fann att den kunde vara klar på bara 8 timmar på en enda NVIDIA Tesla V100 GPU, eller cirka 30 minuter om du använder 16 GPU:er, vilket kan minska analystiden med flera storleksordningar. En arbetsstationsklass NVIDIA RTX 2080TI skulle slutföra den på cirka 12 timmar. "

Igor Sfiligoi, SDSC:s ledande vetenskapliga mjukvaruutvecklare för datorer med hög kapacitet

"Den nya körbara filen kommer också att ha ett enormt värde för undersökande arbete, eftersom den måttliga EMP-datauppsättningen som tidigare krävde 13 timmar på en serverklass-CPU nu kan köras på drygt en timme på en bärbar dator som innehåller en mobil NVIDIA GTX 1050 GPU, "tillade Sfiligoi.

Sfiligoi har samarbetat med Rob Knight, grundande chef för Center for Microbiome Innovation, och professor i pediatrik, Bioingenjör och datavetenskap och teknik vid universitetet, och Daniel McDonald, vetenskaplig chef för American Gut Project. Mikrobiomer är det kombinerade genetiska materialet hos mikroorganismerna i en viss miljö, inklusive människokroppen.

"Detta arbete började inte som en del av COVID-19-svaret, "sa Sfiligoi." Vi startade diskussionen om en sådan hastighet i god tid innan, men UniFrac är en väsentlig del av forskningsledningen COVID-19. "

UniFrac jämför mikrobiomer med varandra med hjälp av ett evolutionärt träd som relaterar DNA -sekvenserna till varandra. "UniFrac spelade en nyckelroll i Human Microbiome Project, tillåter oss att förstå hur mikrober är relaterade i våra kroppar, och i Earth Microbiome Project, tillåter oss att förstå hur mikrober är relaterade över hela vår planet, "sa Knight." Vi använder det för att förstå hur en persons mikrobiom kan göra dem mer eller mindre mottagliga för COVID-19, och vilka mikrober i miljöer som sträcker sig från sjukvårdsanläggningar till avlopp till havsspray gör miljön mer eller mindre gästfri för SARS-CoV-2, coronaviruset som orsakar COVID-19. "

Knight noterade att Sfiligoi hade påskyndat den senaste versionen av algoritmen, publicerad för mindre än två år sedan i Naturmetoder , som redan representerade en dramatisk hastighetsförbättring jämfört med tidigare implementeringar.

"När mikrobiell sekvensdata ökar exponentiellt, från dussintals sekvenser till miljarder, vi måste implementera alla algoritmer igen, "sa han." Det här senaste steget visar verkligen hur optimering av forskningsinfrastrukturen dramatiskt kan minska tid till resultat samtidigt som fyndens riktighet bevaras och möjliggör helt nya frågor. "

Specifikt, Sfiligoi används OpenACC, en användardriven, direktbaserad parallell programmeringsmodell för att överföra den befintliga Striped UniFrac-implementeringen till GPU:er eftersom detta tillåter en enda kodbas för både CPU och GPU-kod. Ytterligare hastighet erhölls genom att noggrant utnyttja cacheplatsen. Dessutom undersöktes användningen av matematik med lägre precision för att effektivt utnyttja grafikkort av konsumentkvalitet som vanligtvis finns på stationära och bärbara datorer.

UniFrac designades och implementerades ursprungligen med hjälp av matta med högre precision, flytande punkt, kallas ofta fp64 -kodväg. Matematiken för flytande punkt med högre precision användes för att maximera tillförlitligheten i resultaten. Efter att ha genomfört matten med flytande punkt med lägre precision, kallas vanligtvis fp32 -kodväg, forskare observerade nästan identiska resultat, men med betydligt kortare beräkningstider.

"Vi såg en 3x snabbare hastighet i fp32-kodvägen för spel-GPU:er som 2080 Ti och den mobila 1050, och vi anser att precision bör vara tillräcklig för de allra flesta studierna, "förklarade Sfiligoi.

Dessutom, kodändringarna som introducerades för att påskynda GPU -beräkningen påskyndade också avsevärt körningen på CPU -resurser. Beräkningsutmaningen som nämns ovan kan nu slutföras på cirka 200 timmar på samma serverklass-CPU, en 4x hastighet, enligt forskarna.

"Gör beräkning tillgänglig på GPU-aktiverade personliga enheter, även bärbara datorer, eliminerar ett stort hinder inom resursinfrastrukturen för många forskare, sa Sfiligoi.