Kezdeti eredményeink felülmúlták a legoptimistább várakozásainkat. Tesztként egy számítási feladatot választottunk, amelyet korábban úgy értékeltünk, hogy körülbelül 900 órát igényel a szerverosztályú CPU -k használatával, vagy kb 13, 000 CPU magóra. Azt találtuk, hogy egyetlen NVIDIA Tesla V100 GPU -val mindössze 8 óra alatt elkészülhet, vagy körülbelül 30 perc, ha 16 GPU -t használ, ami több nagyságrenddel csökkentheti az elemzés futási idejét. Egy munkaállomás-osztályú NVIDIA RTX 2080TI körülbelül 12 óra alatt befejezi. "
Igor Sfiligoi, Az SDSC vezető tudományos szoftverfejlesztője a nagy teljesítményű számítástechnikában
"Az új futtatható fájl a felderítő munka szempontjából is óriási értékű lesz, mivel a közepes méretű EMP-adatkészlet, amely korábban 13 órát igényelt egy szerverosztályú CPU-n, most alig több mint egy óra alatt futtatható mobil NVIDIA GTX 1050 GPU-t tartalmazó laptopon, - tette hozzá Sfiligoi.
Sfiligoi együttműködik Rob Knight -tal, a Microbiome Innovation Center alapító igazgatója, és a gyermekgyógyászat professzora, Biomérnöki és számítástechnikai és mérnöki tudományok az egyetemen, és Daniel McDonald, az American Gut Project tudományos igazgatója. A mikrobiomák a mikroorganizmusok egyesített genetikai anyaga egy adott környezetben, beleértve az emberi testet is.
"Ez a munka kezdetben nem a COVID-19 válasz részeként kezdődött, -mondta Sfiligoi.-Az ilyen gyorsításról szóló vitát jóval korábban elkezdtük, de az UniFrac a COVID-19 kutatási folyamat lényeges része. "
Az UniFrac összehasonlítja a mikrobiomákat egymással egy evolúciós fa segítségével, amely a DNS -szekvenciákat egymáshoz viszonyítja. "Az UniFrac kulcsszerepet játszott a Human Microbiome Projectben, lehetővé téve számunkra, hogy megértsük, hogyan kapcsolódnak a mikrobák a testünkhöz, és a Föld mikrobiom projektjében, lehetővé téve számunkra, hogy megértsük a mikrobák kapcsolatát bolygónkon, -mondta Knight.-Ezt arra használjuk, hogy megértsük, hogyan teheti egy személy mikrobiomája többé-kevésbé fogékonnyá a COVID-19-et, és milyen mikrobák teszik az egészséget az egészségügyi létesítményektől a szennyvíztől az óceáni permetezésig terjedő környezetben, hogy a környezet többé-kevésbé vendégszeretővé váljon a SARS-CoV-2 számára, a COVID-19-t okozó koronavírus. "
Knight megjegyezte, hogy Sfiligoi felgyorsította az algoritmus legújabb verzióját, kevesebb mint két éve jelent meg Természeti módszerek , amely már önmagában is drámai sebességnövekedést jelentett a korábbi megvalósításokhoz képest.
"Miközben a mikrobiális szekvenciaadatok exponenciálisan növekednek, sorozatok tucatjaitól milliárdokig, újra kell hajtanunk az összes algoritmust, "Ez a legutóbbi lépés valóban megmutatja, hogy a kutatási infrastruktúra optimalizálása hogyan csökkentheti drámaian az eredményhez vezető időt, miközben megőrzi a megállapítások pontosságát és lehetővé teszi a kérdések teljesen új skálájának feltételét."
Kimondottan, Sfiligoi OpenACC -t használt, felhasználóközpontú, direktíva-alapú párhuzamos programozási modell a meglévő csíkos UniFrac-implementáció GPU-kba történő portolására, mivel ez lehetővé teszi egyetlen kódbázist mind a CPU, mind a GPU-kód számára. További gyorsítást a gyorsítótár helyének óvatos kihasználásával szereztek be. Szintén feltárták az alacsonyabb pontosságú hőtágulási pont matematika használatát az asztali és laptop számítógépekben jellemzően fogyasztói minőségű GPU-k hatékony kihasználása érdekében.
Az UniFrac -ot eredetileg nagyobb pontosságú lebegőpontos matematika segítségével tervezték és valósították meg, gyakran fp64 kódútnak nevezik. A nagyobb pontosságú lebegőpontos matematikát használtuk az eredmények megbízhatóságának maximalizálására. Az alacsonyabb pontosságú lebegőpontos matematika végrehajtása után általában fp32 kódútnak nevezik, a kutatók közel azonos eredményeket tapasztaltak, de lényegesen rövidebb számítási idővel.
"Háromszoros gyorsítást láttunk az fp32 kódúton az olyan játék GPU-k esetében, mint a 2080 Ti és a mobil 1050, és úgy gondoljuk, hogy a vizsgálatok túlnyomó többségének megfelelőnek kell lennie a pontosságnak, - magyarázta Sfiligoi.
Ráadásul, a GPU -számítás felgyorsítása érdekében bevezetett kódváltozások jelentősen felgyorsították a CPU -erőforrások végrehajtását is. A fent említett számítási feladatok körülbelül 200 óra alatt teljesíthetők ugyanazon a szerverosztályú CPU-n, 4x gyorsítás, a kutatók szerint.
"A számítás elérhetővé tétele GPU-kompatibilis személyi eszközökön, akár laptopok, számos tudós számára kiküszöböli az erőforrás -infrastruktúrán belüli nagy akadályokat, - mondta Sfiligoi.