Mūsų pradiniai rezultatai pranoko optimistiškiausius lūkesčius. Kaip bandymą pasirinkome skaičiavimo iššūkį, kurį anksčiau įvertinome kaip reikalaujantį maždaug 900 valandų laiko naudojant serverio klasės procesorius, arba apie 13, 000 procesoriaus pagrindinių valandų. Mes nustatėme, kad naudojant „NVIDIA Tesla V100“ GPU jis gali būti baigtas vos per 8 valandas, arba maždaug 30 minučių, jei naudojate 16 GPU, kuris galėtų sutrumpinti analizės trukmę keliais dydžiais. Darbo vietos klasės „NVIDIA RTX 2080TI“ ją užbaigtų maždaug per 12 valandų.
Igoris Sfiligoi, Pagrindinis SDSC mokslinės programinės įrangos, skirtos didelio našumo skaičiavimui, kūrėjas
„Naujasis vykdomasis failas taip pat turės didžiulę vertę tiriamiesiems darbams, kadangi vidutinio dydžio EMP duomenų rinkinys, kuriam anksčiau reikėjo 13 valandų serverio klasės procesoriaus, dabar gali būti paleistas šiek tiek daugiau nei per valandą nešiojamajame kompiuteryje, kuriame yra mobilusis NVIDIA GTX 1050 GPU, “ - pridūrė Sfiligoi.
Sfiligoi bendradarbiauja su Rob Knight, mikrobiomų inovacijų centro įkūrėjas, ir pediatrijos profesorius, Bioinžinerija ir informatika bei inžinerija universitete, ir Danielis McDonaldas, Amerikos žarnų projekto mokslinis direktorius. Mikrobiomos yra tam tikros aplinkos mikroorganizmų genetinė medžiaga, įskaitant žmogaus kūną.
„Šis darbas iš pradžių neprasidėjo kaip COVID-19 atsako dalis, -sakė Sfiligoi.-Diskusiją apie tokį pagreitinimą pradėjome gerokai anksčiau, tačiau „UniFrac“ yra esminė COVID-19 tyrimų dalis “.
„UniFrac“ lygina mikrobiomas viena su kita, naudodamas evoliucinį medį, kuris susieja DNR sekas viena su kita. „„ UniFrac “atliko pagrindinį vaidmenį žmogaus mikrobiomų projekte, leidžia mums suprasti, kaip mikrobai yra susiję mūsų kūnuose, ir Žemės mikrobiomų projekte, leidžia mums suprasti, kaip mūsų planetoje yra susiję mikrobai, "sakė riteris." Mes naudojame tai norėdami suprasti, kaip žmogaus mikrobiomas gali padaryti jį daugiau ar mažiau jautrų COVID-19, ir kokie mikrobai aplinkoje nuo sveikatos priežiūros įstaigų iki nuotekų iki vandenyno purškimo daro aplinką daugiau ar mažiau svetingą iki SARS-CoV-2, koronavirusas, sukeliantis COVID-19 “.
Knight pažymėjo, kad Sfiligoi paspartino naujausią algoritmo versiją, paskelbtas mažiau nei prieš dvejus metus Gamtos metodai , tai jau žymiai pagerino greitį, palyginti su ankstesniais diegimais.
„Kadangi mikrobų sekos duomenys didėja eksponentiškai, nuo dešimčių sekų iki milijardų, turime iš naujo įdiegti visus algoritmus, Šis paskutinis žingsnis tikrai parodo, kaip optimizavus mokslinių tyrimų infrastruktūrą galima žymiai sutrumpinti laiką iki rezultato, tuo pat metu išlaikant išvadų tikslumą ir suteikiant galimybę užduoti visiškai naujas klausimų mastas.
Konkrečiai, „Sfiligoi“ naudojo „OpenACC“, vartotojo orientuotas, direktyvomis pagrįstas lygiagretaus programavimo modelis, skirtas perkelti esamą dryžuotą „UniFrac“ diegimą į GPU, nes tai leidžia vieną kodų bazę tiek procesoriui, tiek GPU kodui. Papildomas pagreitis buvo gautas kruopščiai išnaudojant talpyklos vietą. Taip pat buvo ištirtas mažesnio tikslumo sklidimo taško matematikos naudojimas siekiant efektyviai išnaudoti vartotojų klasės GPU, paprastai randamus staliniuose ir nešiojamuose kompiuteriuose.
„UniFrac“ iš pradžių buvo sukurtas ir visada įgyvendintas naudojant didesnio tikslumo slankiojo kablelio matematiką, dažnai vadinamas fp64 kodo keliu. Siekiant didesnio rezultatų patikimumo, buvo naudojama didesnio tikslumo slankiojo kablelio matematika. Įdiegus mažesnio tikslumo slankiojo kablelio matematiką, paprastai vadinamas fp32 kodo keliu, tyrėjai pastebėjo beveik identiškus rezultatus, bet su žymiai trumpesniu skaičiavimo laiku.
„Mes matėme 3 kartus spartesnį žaidimų GPU, tokių kaip„ 2080 Ti “ir„ 1050 “, fp32 kodo kelią. ir mes manome, kad tikslumas turėtų būti pakankamas daugumai tyrimų, “, - aiškino Sfiligoi.
Be to, įvesti kodo pakeitimai, siekiant pagreitinti GPU skaičiavimą, taip pat žymiai pagreitino procesoriaus išteklių vykdymą. Pirmiau minėtas skaičiavimo uždavinys gali būti atliktas per maždaug 200 valandų naudojant tą patį serverio klasės procesorių, 4x pagreitis, pasak tyrėjų.
„Skaičiavimo prieinamumas asmeniniuose GPU palaikančiuose įrenginiuose, net nešiojamieji kompiuteriai, pašalina didelę kliūtį daugelio mokslininkų išteklių infrastruktūroje, “ - sakė Sfiligoi.