Výpočetně náročné úlohy z oblasti sekvenování nové generace

Partner: Fakultní nemocnice Ostrava

Odvětví: zdravotnictví

 

Oddělení lékařské genetiky má v rámci Fakultní nemocnice Ostrava výjimečné postavení vzhledem ke svému nadregionálnímu významu vyplývajícímu ze spádovosti oblasti Moravskoslezského kraje. 

Lékařská genetika je multidisciplinární obor, jehož výsledky se promítají do všech oblastí lékařské péče a jejich hlavním zaměřením je prevence.

Odborníci genetického oddělení FNO poskytují genetické poradenství a provádí specializovaná vyšetření ve spolupráci se svými cytogenetickými a molekulárně genetickými laboratořemi i s laboratořemi v celé České republice a v zahraničí.

Zabývají se diagnostikou vrozených vývojových vad, vývojových poruch v dětském věku, monogenních onemocnění, onkologických, neurologických a neurodegenerativních onemocnění atd. Mnoho jejich klientů tvoří i těhotné ženy a páry plánující těhotenství. Proto se v rámci oddělení zabývají také diagnostikou poruch plodnosti a plánováním těhotenství u párů nesoucích genetická onemocnění, rodinnou zátěž nebo u párů v příbuzenském vztahu.

 

Hlavním cílem této spolupráce bylo:

  • Otestovat provádění složitých výpočetních úloh z oblasti moderní metody sekvenování DNA tzv. sekvenování nové generace (NGS).
  • Poskytnout tak potřebné informace pro pořízení specializovaného zařízení, které zpracovává výsledky genetického screeningu pacientů.

Úkolem pro superpočítače IT4Innovations národního superpočítačového centra bylo pomoci získat základní údaje z hlediska výpočetní složitosti, škálovatelnosti a objemu dat zřetězeného zpracování NGS výpočtů (pipeline).

 

K testování složitosti zpracování dat NGS byly použity české superpočítače Barbora a Karolina. Nejmodernější zpracovatelská pipeline je napsána v jazyce Nextflow workflow a umožňuje tak plně využít dostupné výpočetní zdroje superpočítačů. Pipeline Nextflow se skládá z procesů, které provádějí danou úlohu na vstupních datech ­– pipeline sleduje, které procesy nebo samotné úlohy mohou běžet paralelně, aby nebyl překročen limit přidělených výpočetních uzlů a s tím související počet CPU (centrálních procesorových jednotek).

Testování proběhlo na dvou typech dat, které obsahovaly informace o celkem 20 pacientech (exom: velký, 3 pacienti; a panel: malý, panel MR-MIKRO4, 17 pacientů). Výsledné statistiky, tzv. benchmarky, sledující využití CPU, paměti a dat byly získány pro každý typ zpracovávaných dat a každou část výpočetní pipeline.

Výsledek spolupráce se skládá z řady srovnávacích výkonových testů pro zpracování dat NGS, které byly provedeny na superpočítačích tak, aby poskytly základní údaje z hlediska výpočetních a datových nároků.

Díky spolupráci byla úspěšně získána požadovaná východiska pro pořízení specializovaného zařízení pro zpracování výsledků genetického screeningu pacientů.

„Toto zařízení, které plánujeme umístit na oddělení lékařské genetiky, by mělo výrazně zefektivnit a urychlit zpracování podkladů genetického screeningu pacientů.“, upřesňuje Jiří Novotný, Oddělení lékařské genetiky FNO.