Stomach Health > Maag Gezondheid >  > Q and A > maag vraag

UniFrac-microbioomtool geoptimaliseerd voor computer-GPU's

Onderzoekers van het San Diego Supercomputer Center (SDSC) van de University of California San Diego hebben hun expertise op het gebied van high-performance computing toegepast door de populaire UniFrac-microbioomtool over te zetten naar grafische verwerkingseenheden (GPU's) in een poging de versnelling en nauwkeurigheid van wetenschappelijke ontdekking, inclusief dringend noodzakelijk COVID-19-onderzoek.

Onze eerste resultaten overtroffen onze meest optimistische verwachtingen. Als test hebben we een computeruitdaging geselecteerd waarvan we eerder hebben gemeten dat deze ongeveer 900 uur tijd kostte met behulp van serverklasse-CPU's, of ongeveer 13, 000 CPU-kernuren. We ontdekten dat het in slechts 8 uur kon worden voltooid op een enkele NVIDIA Tesla V100 GPU, of ongeveer 30 minuten bij gebruik van 16 GPU's, die analyseruntimes met verschillende ordes van grootte zou kunnen verminderen. Een NVIDIA RTX 2080TI van werkstationklasse zou het in ongeveer 12 uur voltooien."

Igor Sfiligoi, SDSC's leidende wetenschappelijke softwareontwikkelaar voor high-throughput computing

"Het nieuwe uitvoerbare bestand zal ook van enorme waarde zijn voor verkennend werk, aangezien de middelgrote EMP-dataset die vroeger 13 uur nodig had op een serverklasse CPU, nu in iets meer dan een uur kan worden uitgevoerd op een laptop met een mobiele NVIDIA GTX 1050 GPU, ", voegde Sfiligoi eraan toe.

Sfiligoi heeft samengewerkt met Rob Knight, stichtend directeur van het Center for Microbiome Innovation, en een professor in de kindergeneeskunde, Bioengineering en Computer Science &Engineering aan de universiteit, en Daniël McDonald, wetenschappelijk directeur van het American Gut Project. Microbiomen zijn het gecombineerde genetische materiaal van de micro-organismen in een bepaalde omgeving, inclusief het menselijk lichaam.

"Dit werk begon aanvankelijk niet als onderdeel van de COVID-19-reactie, "zei Sfiligoi. "We zijn de discussie over zo'n versnelling ruim eerder begonnen, maar UniFrac is een essentieel onderdeel van de COVID-19-onderzoekspijplijn."

UniFrac vergelijkt microbiomen met elkaar met behulp van een evolutionaire boom die de DNA-sequenties aan elkaar relateert. "UniFrac speelde een sleutelrol in het Human Microbiome Project, ons in staat stellen te begrijpen hoe microben in ons lichaam verwant zijn, en in het Earth Microbiome Project, waardoor we begrijpen hoe microben op onze planeet verwant zijn, " zei Knight. "We gebruiken het om te begrijpen hoe het microbioom van een persoon hen meer of minder vatbaar maakt voor COVID-19, en welke microben in omgevingen, variërend van gezondheidszorgfaciliteiten tot rioolwater tot oceaanspray, de omgeving min of meer gastvrij maken voor SARS-CoV-2, het coronavirus dat COVID-19 veroorzaakt."

Knight merkte op dat Sfiligoi de nieuwste versie van het algoritme had versneld, minder dan twee jaar geleden gepubliceerd in Natuurmethoden , die zelf al een dramatische snelheidsverbetering vertegenwoordigde ten opzichte van eerdere implementaties.

"Naarmate microbiële sequentiegegevens exponentieel toenemen, van tientallen reeksen tot miljarden, we moeten alle algoritmen opnieuw implementeren, "zei hij. "Deze laatste stap laat echt zien hoe het optimaliseren van de onderzoeksinfrastructuur de time-to-result drastisch kan verminderen, terwijl de nauwkeurigheid van de bevindingen behouden blijft en volledig nieuwe schaal van vragen kan worden gesteld."

specifiek, Sfiligoi gebruikte OpenACC, een door de gebruiker gestuurde, op richtlijnen gebaseerd parallel programmeermodel om de bestaande Striped UniFrac-implementatie over te zetten naar GPU's, omdat dit een enkele codebase mogelijk maakt voor zowel CPU- als GPU-code. Extra snelheid werd verkregen door zorgvuldig gebruik te maken van de cachelocatie. Ook werd het gebruik van lagere-precisie drijfpuntberekeningen onderzocht om eectief gebruik te maken van GPU's van consumentenkwaliteit die doorgaans worden aangetroffen in desktop- en laptopcomputers.

UniFrac is oorspronkelijk ontworpen en altijd geïmplementeerd met behulp van hogere precisie drijvende-komma wiskunde, vaak fp64-codepad genoemd. De hogere precisie drijvende-komma wiskunde werd gebruikt om de betrouwbaarheid van de resultaten te maximaliseren. Na het implementeren van de zwevende-komma-wiskunde met lagere precisie, meestal fp32-codepad genoemd, onderzoekers zagen bijna identieke resultaten, maar met aanzienlijk kortere rekentijden.

"We zagen een 3x snellere snelheid in het fp32-codepad voor gaming-GPU's zoals de 2080 Ti en de mobiele 1050, en wij zijn van mening dat precisie voldoende moet zijn voor de overgrote meerderheid van de onderzoeken, " legde Sfiligoi uit.

Bovendien, de codewijzigingen die zijn geïntroduceerd om de GPU-berekening te versnellen, hebben ook de uitvoering van CPU-bronnen aanzienlijk versneld. De hierboven genoemde computationele uitdaging kan nu in ongeveer 200 uur worden voltooid op dezelfde serverklasse CPU, een 4x versnelling, volgens de onderzoekers.

"Berekening beschikbaar maken op persoonlijke apparaten met GPU-ondersteuning, zelfs laptops, elimineert een grote barrière binnen de hulpbronneninfrastructuur voor veel wetenschappers, ' zei Sfiligoi.