Stomach Health > želudac Zdravlje >  > Q and A > želudac pitanje

UniFrac mikrobiomski alat optimiziran za grafičke procesore računala

Istraživači u Centru superračunala San Diego (SDSC) na Kalifornijskom sveučilištu u San Diegu primjenjuju svoje računalno znanje visokih performansi prenoseći popularni UniFrac mikrobiomski alat na grafičke procesorske jedinice (GPU-ove) u pokušaju da povećaju ubrzanje i točnost znanstveno otkriće, uključujući hitno potrebna istraživanja COVID-19.

Naši početni rezultati nadmašili su naša najoptimističnija očekivanja. Kao test smo odabrali računalni izazov za koji smo prethodno mjerili da mu je potrebno oko 900 sati korištenja pomoću CPU -a klase poslužitelja, ili oko 13, 000 sati jezgre procesora. Otkrili smo da bi mogao biti gotov za samo 8 sati na jednom NVIDIA Tesla V100 GPU -u, ili oko 30 minuta ako koristite 16 grafičkih procesora, što bi moglo smanjiti vrijeme izvođenja analize za nekoliko redova veličine. NVIDIA RTX 2080TI klase radne stanice završila bi to za otprilike 12 sati. "

Igor Sfiligoi, SDSC-ov vodeći znanstveni programer za visokopropusno računarstvo

"Nova izvršna datoteka također će imati ogromnu vrijednost za istraživački rad, budući da se skup podataka EMP-a umjerene veličine koji je nekad zahtijevao 13 sati na CPU-u klase poslužitelja sada može pokrenuti za nešto više od jednog sata na prijenosnom računalu koje sadrži mobilni NVIDIA GTX 1050 GPU, "dodao je Sfiligoi.

Sfiligoi je surađivao s Robom Najtom, direktor osnivač Centra za mikrobiomske inovacije, i profesor pedijatrije, Bioinženjering i računalne znanosti i inženjering na sveučilištu, i Daniel McDonald, znanstveni direktor American Gut Project. Mikrobiomi su kombinirani genetski materijal mikroorganizama u određenom okruženju, uključujući i ljudsko tijelo.

"Ovaj rad u početku nije započeo kao dio odgovora na COVID-19, "rekao je Sfiligoi." Raspravu o takvom ubrzanju započeli smo mnogo prije, ali UniFrac je bitan dio cjevovoda istraživanja COVID-19. "

UniFrac uspoređuje mikrobiome jedan s drugim pomoću evolucijskog stabla koje međusobno povezuje DNK sekvence. "UniFrac je odigrao ključnu ulogu u projektu Human Microbiome Project, omogućujući nam da razumijemo kako su mikrobi povezani u našem tijelu, i u projektu Zemljin mikrobiom, omogućujući nam da razumijemo kako su mikrobi povezani na cijelom našem planetu, "rekao je Knight." Koristimo ga kako bismo razumjeli kako bi mikrobiom neke osobe mogao učiniti više ili manje osjetljivu na COVID-19, i koji mikrobi u okruženjima, od zdravstvenih ustanova do kanalizacije do prskanja oceana, čine okoliš manje-više gostoljubivim za SARS-CoV-2, koronavirus koji uzrokuje COVID-19. "

Knight je primijetio da je Sfiligoi ubrzao najnoviju verziju algoritma, objavljeno prije manje od dvije godine u Metode prirode , što je već predstavljalo dramatično poboljšanje brzine u odnosu na prethodne implementacije.

"Kako se podaci o mikrobiološkom slijedu eksponencijalno povećavaju, od desetaka sekvenci do milijardi, moramo ponovno implementirati sve algoritme, "rekao je." Ovaj najnoviji korak doista pokazuje kako optimiziranje istraživačke infrastrukture može dramatično smanjiti vrijeme do rezultata, a pritom očuvati točnost nalaza i omogućiti postavljanje potpuno novih ljestvica pitanja. "

Posebno, Sfiligoi je koristio OpenACC, vođen korisnicima, model paralelnog programiranja temeljen na direktivama za prijenos postojeće implementacije Striped UniFrac na grafičke procesore jer to omogućuje jedinstvenu bazu kodova i za CPU i za GPU kod. Dodatno ubrzanje postignuto je pažljivim iskorištavanjem predmemorije. Također je istražena upotreba matematike plutajućih točaka niže preciznosti za učinkovito iskorištavanje GPU-ova potrošačke klase koji se obično nalaze u stolnim i prijenosnim računalima.

UniFrac je izvorno dizajniran i uvijek implementiran pomoću matematike s pomičnom zarezom veće preciznosti, često se naziva putanja koda fp64. Matematika s plutajućom zarezom veće preciznosti korištena je za maksimalnu pouzdanost rezultata. Nakon implementacije matematike s plutajućom zarezom niže preciznosti, obično se naziva kôd fp32, istraživači su primijetili gotovo identične rezultate, ali sa znatno kraćim vremenom računanja.

"Vidjeli smo 3x ubrzanje u putanji koda fp32 za gaming grafičke procesore kao što su 2080 Ti i mobilni 1050, i vjerujemo da bi preciznost trebala biti primjerena velikoj većini studija, "objasnio je Sfiligoi.

Štoviše, promjene koda uvedene kako bi se ubrzalo računanje GPU -a također su značajno ubrzale izvršavanje CPU resursa. Računalni izazov gore spomenut sada se može riješiti za oko 200 sati na istom CPU-u klase poslužitelja, 4x ubrzanje, prema istraživačima.

"Omogućavanje izračunavanja na osobnim uređajima s GPU-om, čak i prijenosna računala, uklanja mnoge prepreke unutar resursne infrastrukture za mnoge znanstvenike, "rekao je Sfiligoi.