Ensimmäiset tulokset ylittivät optimistisimmat odotuksemme. Testinä valitsimme laskennallisen haasteen, jonka aiemmin arvioimme vaativan noin 900 tuntia aikaa palvelinluokan suorittimilla, tai noin 13, 000 suorittimen ydintuntia. Huomasimme, että se voisi olla valmis vain 8 tunnissa yhdellä NVIDIA Tesla V100 GPU:lla, tai noin 30 minuuttia, jos käytät 16 GPU:ta, joka voisi lyhentää analyysiajoa usealla suuruusluokalla. Työasemaluokan NVIDIA RTX 2080TI saisi sen valmiiksi noin 12 tunnissa. "
Igor Sfiligoi, SDSC:n johtava tieteellinen ohjelmistokehittäjä tehokkaaseen tietojenkäsittelyyn
"Uudella suoritettavalla ohjelmalla on myös valtava arvo tutkimustyössä, Keskikokoinen EMP-tietojoukko, joka aikaisemmin vaati 13 tuntia palvelinluokan suorittimessa, voidaan nyt suorittaa hieman yli tunnissa kannettavalla tietokoneella, joka sisältää mobiilin NVIDIA GTX 1050 -näytönohjaimen, "Sfiligoi lisäsi.
Sfiligoi on tehnyt yhteistyötä Rob Knightin kanssa, Microbiome Innovation Centerin perustaja, ja lastentautien professori, Biotekniikka ja tietojenkäsittelytiede yliopistossa, ja Daniel McDonald, American Gut Projectin tieteellinen johtaja. Mikrobiomit ovat mikro -organismien yhdistetty geneettinen materiaali tietyssä ympäristössä, mukaan lukien ihmiskeho.
"Tämä työ ei aluksi alkanut osana COVID-19-vastausta, "sanoi Sfiligoi." Aloitimme keskustelun tällaisesta nopeuttamisesta hyvissä ajoin, mutta UniFrac on olennainen osa COVID-19-tutkimusputkea. "
UniFrac vertaa mikrobiomeja toisiinsa käyttämällä kehityspuuta, joka yhdistää DNA -sekvenssit toisiinsa. "UniFracilla oli keskeinen rooli ihmisen mikrobiomiprojektissa, jonka avulla voimme ymmärtää, miten mikrobit liittyvät toisiinsa kehossamme, ja Earth Microbiome Projectissa, jonka avulla voimme ymmärtää, miten mikrobit liittyvät toisiinsa planeetallamme, "sanoi Knight." Käytämme sitä ymmärtääksemme, kuinka ihmisen mikrobiomi saattaa tehdä hänestä enemmän tai vähemmän alttiita COVID-19:lle, ja mitkä mikrobit ympäristöissä, jotka vaihtelevat terveydenhuollon laitoksista viemäriin ja merisuihkuun, tekevät ympäristöstä enemmän tai vähemmän vieraanvaraisen SARS-CoV-2:een, koronavirus, joka aiheuttaa COVID-19:n. "
Knight totesi, että Sfiligoi oli nopeuttanut algoritmin uusinta versiota, julkaistu alle kaksi vuotta sitten Luonnon menetelmät , joka jo edisti dramaattista nopeuden paranemista aiempiin toteutuksiin verrattuna.
"Kun mikrobisekvenssitiedot lisääntyvät eksponentiaalisesti, kymmenistä sekvensseistä miljardeihin, meidän on otettava kaikki algoritmit uudelleen käyttöön, "Hän sanoi." Tämä viimeisin vaihe osoittaa todella, kuinka tutkimusinfrastruktuurin optimointi voi lyhentää dramaattisesti aikaa tulokseen säilyttäen samalla tulosten tarkkuuden ja mahdollistamalla täysin uusien kysymysten esittämisen. "
Erityisesti, Sfiligoi käytti OpenACC:tä, käyttäjälähtöinen, direktiivipohjainen rinnakkaisohjelmointimalli nykyisen raidallisen UniFrac-toteutuksen siirtämiseksi grafiikkasuorittimiin, koska tämä mahdollistaa yhden koodikannan sekä CPU- että GPU-koodille. Lisänopeutta saatiin hyödyntämällä huolellisesti välimuistipaikkaa. Tutkittiin myös alemman tarkkuuden liukupisteiden matematiikan käyttöä kuluttajalaatuisten grafiikkasuorittimien tehokkaaseen hyödyntämiseen, joita tyypillisesti löytyy pöytä- ja kannettavista tietokoneista.
UniFrac on alun perin suunniteltu ja toteutettu aina käyttämällä tarkempaa liukulukulaskua, kutsutaan usein fp64 -koodipoluksi. Tulosten luotettavuuden maksimoimiseksi käytettiin korkeamman tarkkuuden liukulukulaskua. Kun olet ottanut käyttöön alemman tarkkuuden liukulukulaskennan, kutsutaan yleensä fp32 -koodipoluksi, tutkijat havaitsivat lähes identtiset tulokset, mutta huomattavasti lyhyemmät laskenta -ajat.
"Näimme kolminkertaisen nopeuden fp32-koodireitillä pelien GPU:ille, kuten 2080 Ti ja mobile 1050, ja uskomme, että tarkkuuden pitäisi riittää valtaosalle tutkimuksista, "selitti Sfiligoi.
Lisäksi, GPU -laskennan nopeuttamiseksi tehdyt koodimuutokset nopeuttivat myös merkittävästi suoritinresurssien suorittamista. Edellä mainittu laskentahaaste voidaan nyt suorittaa noin 200 tunnissa samalla palvelinluokan suorittimella, 4x nopeus, tutkijoiden mukaan.
"Laskennan asettaminen saataville GPU-yhteensopivilla henkilökohtaisilla laitteilla, jopa kannettavat tietokoneet, poistaa suuren esteen resurssi -infrastruktuurissa monille tutkijoille, "sanoi Sfiligoi.