Naši začetni rezultati so presegli naša najbolj optimistična pričakovanja. Kot test smo izbrali računalniški izziv, za katerega smo prej merili, da potrebuje približno 900 ur časa z uporabo procesorjev razreda strežnika, ali približno 13, 000 ur procesorja. Ugotovili smo, da bi ga lahko na enem grafičnem procesorju NVIDIA Tesla V100 končali v samo 8 urah, ali približno 30 minut, če uporabljate 16 grafičnih procesorjev, kar bi lahko zmanjšalo čas izvajanja analize za več vrst. Delovna postaja razreda NVIDIA RTX 2080TI bi jo končala v približno 12 urah. "
Igor Sfiligoi, SDSC vodilni znanstveni razvijalec programske opreme za visoko zmogljivo računalništvo
"Nova izvedljiva datoteka bo imela izjemno vrednost tudi pri raziskovalnem delu, ker je nabor podatkov EMP zmerne velikosti, ki je včasih potreboval 13 ur na procesorju razreda strežnika, zdaj mogoče zagnati v nekaj več kot eni uri na prenosnem računalniku, ki vsebuje mobilno grafično kartico NVIDIA GTX 1050, "je dodal Sfiligoi.
Sfiligoi sodeluje z Robom Knightom, ustanovni direktor Centra za mikrobiomske inovacije, in profesor pediatrije, Bioinženiring in računalništvo in inženiring na univerzi, in Daniel McDonald, znanstveni direktor ameriškega projekta Gut. Mikrobiomi so združeni genetski material mikroorganizmov v določenem okolju, vključno s človeškim telesom.
"To delo se sprva ni začelo kot del odziva na COVID-19, "je rekel Sfiligoi." Razpravo o takšnem pospeševanju smo začeli že precej prej, vendar je UniFrac bistven del raziskovalnega načrta za COVID-19. "
UniFrac med seboj primerja mikrobiome z uporabo evolucijskega drevesa, ki med seboj povezuje zaporedja DNK. "UniFrac je imel ključno vlogo pri projektu človeškega mikrobioma, nam omogoča, da razumemo, kako so mikrobi povezani v našem telesu, in v projektu Microbiome Earth, nam omogoča, da razumemo, kako so mikrobi povezani na našem planetu, "je dejal Knight." Uporabljamo ga za razumevanje, kako bi lahko mikrobiom osebe naredil bolj ali manj dovzetne za COVID-19, in kateri mikrobi v okoljih, od zdravstvenih ustanov do odplak do oceanskega pršenja, naredijo okolje bolj ali manj gostoljubno do SARS-CoV-2, koronavirus, ki povzroča COVID-19. "
Knight je opozoril, da je Sfiligoi pospešil najnovejšo različico algoritma, objavljeno pred manj kot dvema letoma v Naravne metode , kar je že predstavljalo dramatično izboljšanje hitrosti v primerjavi s prejšnjimi izvedbami.
"Ker se podatki o mikrobnem zaporedju eksponentno povečujejo, od desetine zaporedij do milijard, moramo znova implementirati vse algoritme, "je dejal." Ta zadnji korak resnično kaže, kako lahko optimizacija raziskovalne infrastrukture dramatično skrajša čas do rezultata, hkrati pa ohrani natančnost ugotovitev in omogoči postavljanje popolnoma novih lestvic vprašanj. "
Natančneje, Sfiligoi je uporabljal OpenACC, uporabniško usmerjen, model vzporednega programiranja, ki temelji na direktivah za prenos obstoječe izvedbe Striped UniFrac v grafične procesorje, ker to omogoča enotno kodno bazo za kodo CPU in GPU. Dodatno pospešitev smo dosegli s skrbnim izkoriščanjem predpomnilnika. Raziskana je bila tudi uporaba matematike plavajočih točk z nižjo natančnostjo za učinkovito izkoriščanje grafičnih procesorjev za potrošnike, ki jih običajno najdemo v namiznih in prenosnih računalnikih.
UniFrac je bil prvotno zasnovan in vedno izveden z uporabo natančnejše matematike s plavajočo vejico, pogosto imenovana pot kode fp64. Za večjo zanesljivost rezultatov je bila uporabljena matematika z večjo natančnostjo s plavajočo vejico. Po uvedbi matematike s plavajočo vejico z nižjo natančnostjo, običajno imenovana kodna pot fp32, Raziskovalci so opazili skoraj enake rezultate, vendar z bistveno krajšimi računskimi časi.
"V kodni poti fp32 smo videli 3-kratno pospešitev za igralne grafične procesorje, kot sta 2080 Ti in mobilni 1050, in menimo, da bi morala biti natančnost ustrezna za veliko večino študij, "je pojasnil Sfiligoi.
Poleg tega, spremembe kode, ki so bile uvedene za pospešitev izračuna GPU, so tudi znatno pospešile izvajanje virov procesorja. Računalniški izziv, omenjen zgoraj, je zdaj mogoče rešiti v približno 200 urah na istem procesorju razreda strežnika, 4 -kratni pospešek, po mnenju raziskovalcev.
"Omogočanje izračuna na osebnih napravah z GPU, tudi prenosni računalniki, odpravlja veliko oviro v okviru infrastrukture virov za mnoge znanstvenike, "je rekel Sfiligoi.