Stomach Health > žalúdok zdravie >  > Q and A > žalúdok otázka

Mikrobiómový nástroj UniFrac optimalizovaný pre počítačové GPU

Vedci zo superpočítačového centra v San Diegu (SDSC) na Kalifornskej univerzite v San Diegu uplatňujú svoje vysokovýkonné počítačové znalosti tým, že obľúbený mikrobiómový nástroj UniFrac prenášajú do jednotiek grafického spracovania (GPU) v snahe zvýšiť zrýchlenie a presnosť vedecký objav, vrátane naliehavo potrebného výskumu COVID-19.

Naše počiatočné výsledky prekročili naše najoptimistickejšie očakávania. Ako test sme vybrali výpočtovú výzvu, ktorú sme predtým merali tak, že vyžaduje približne 900 hodín času pomocou CPU serverovej triedy, alebo okolo 13, 000 hodín jadra CPU. Zistili sme, že by mohol byť dokončený za pouhých 8 hodín na jednom GPU NVIDIA Tesla V100, alebo asi 30 minút, ak používate 16 grafických kariet, čo by mohlo znížiť dobu trvania analýzy o niekoľko rádov. Pracovná stanica-trieda NVIDIA RTX 2080TI to dokončí za približne 12 hodín. “

Igor Sfiligoi, Vedúci vývojár vedeckého softvéru SDSC pre vysokovýkonné výpočty

„Nový spustiteľný súbor bude mať obrovskú hodnotu aj pre prieskumné práce, keďže stredne veľkú množinu údajov EMP, ktorá kedysi vyžadovala 13 hodín na CPU serverovej triedy, je teraz možné spustiť na notebooku s mobilným grafickým procesorom NVIDIA GTX 1050 za niečo viac ako jednu hodinu, “dodal Sfiligoi.

Sfiligoi spolupracuje s Robom Knightom, zakladajúci riaditeľ Centra pre inováciu mikrobiómov, a profesor pediatrie, Bioinžinierstvo a informatika a inžinierstvo na univerzite, a Daniel McDonald, vedecký riaditeľ projektu American Gut Project. Mikrobiómy sú kombinovaný genetický materiál mikroorganizmov v konkrétnom prostredí, vrátane ľudského tela.

„Táto práca sa pôvodne nezačala ako súčasť reakcie na COVID-19, "Povedal Sfiligoi." Diskusiu o takom zrýchlení sme začali oveľa skôr, UniFrac je však zásadnou súčasťou výskumného kanála COVID-19. “

UniFrac porovnáva mikrobiómy navzájom pomocou evolučného stromu, ktorý navzájom spája sekvencie DNA. „UniFrac zohral kľúčovú úlohu v projekte ľudského mikrobiómu, čo nám umožňuje pochopiť, ako sú mikróby prepojené v našich telách, a v projekte mikrobiómu Zeme, čo nám umožňuje pochopiť, ako sú mikróby prepojené na našej planéte, "povedal Knight." Používame to na pochopenie toho, ako môže mikrobióm človeka spôsobiť, že je viac alebo menej náchylný na COVID-19, a aké mikróby v prostrediach od zdravotníckych zariadení po splašky až po oceánske spreje robia prostredie viac alebo menej pohostinným voči SARS-CoV-2, koronavírus, ktorý spôsobuje COVID-19. "

Knight poznamenal, že Sfiligoi urýchlil najnovšiu verziu algoritmu, publikované pred menej ako dvoma rokmi v Prírodné metódy , čo už samo osebe predstavovalo dramatické zlepšenie rýchlosti oproti predchádzajúcim implementáciám.

"Pretože údaje o mikrobiálnych sekvenciách exponenciálne rastú, od desiatok sekvencií po miliardy, musíme znova implementovať všetky algoritmy, "povedal." Tento posledný krok skutočne ukazuje, ako optimalizácia výskumnej infraštruktúry môže dramaticky skrátiť čas potrebný na dosiahnutie výsledku pri zachovaní presnosti zistení a umožnení klásť úplne nové škály otázok. "

Konkrétne Sfiligoi použil OpenACC, riadený používateľom, model paralelného programovania založený na smernici na prenos existujúcej implementácie Striped UniFrac na GPU, pretože to umožňuje jednu kódovú základňu pre kód CPU aj GPU. Ďalšie zrýchlenie bolo dosiahnuté starostlivým využívaním lokality vyrovnávacej pamäte. Skúmalo sa tiež použitie matematiky pohyblivých bodov s nižšou presnosťou na efektívne využitie GPU spotrebiteľskej triedy, ktoré sa bežne vyskytujú v stolných a prenosných počítačoch.

UniFrac bol pôvodne navrhnutý a vždy implementovaný pomocou vyššej presnosti matematiky s pohyblivou rádovou čiarkou, často sa nazýva cesta kódu fp64. Na maximalizáciu spoľahlivosti výsledkov bola použitá matematika s pohyblivou rádovou čiarkou s vyššou presnosťou. Po implementácii matematiky s pohyblivou rádovou čiarkou s nižšou presnosťou zvyčajne sa nazýva cesta kódu fp32, vedci zistili takmer identické výsledky, ale s výrazne kratšími časmi výpočtu.

„Videli sme 3x zrýchlenie v ceste kódu fp32 pre herné GPU, ako sú 2080 Ti a mobilný 1050, a domnievame sa, že presnosť by mala byť primeraná pre veľkú väčšinu štúdií, “vysvetlil Sfiligoi.

Navyše, zmeny kódu zavedené na urýchlenie výpočtu GPU tiež výrazne urýchlili výkon zdrojov CPU. Výpočtovú výzvu uvedenú vyššie je teraz možné dokončiť približne za 200 hodín na rovnakom CPU serverovej triedy, 4x zrýchlenie, podľa výskumníkov.

„Sprístupnenie výpočtu na osobných zariadeniach s podporou GPU, dokonca aj notebooky, eliminuje veľkú bariéru v rámci infraštruktúry zdrojov pre mnohých vedcov, “povedal Sfiligoi.