Tým z FIT ČVUT stojí za světoznámým nástrojem pro plánování správy dat

Data Stewardship Wizard (DSW), open-source softwarový nástroj vyvinutý týmem na ČVUT v Praze, zjednodušuje proces tvorby plánů správy dat pro vědecký výzkum. DSW provede uživatele tvorbou plánu správy dat, který splňuje zásady FAIR data. Nástroj pomáhá učit jak s daty správně zacházet, udržovat je během projektů a dlouhodobě je distribuovat. DSW propojuje IT s obory jako je medicína, archeologie a vzdělávání.

Představte si tuto situaci: jste vědec a zkoumáte chování určitého druhu bakterie v ekosystému. Zajímá vás, jak vypadá životní cyklus této bakterie, jaké jsou korelace s jejím přirozeným prostředím a tak dále. Dozvíte se spoustu informací, ale jen některé z nich jsou přímým předmětem vašeho výzkumu. Jinými slovy pouze některá data jsou pro vás důležitá. Co s tím zbytkem? Smažeme ho nebo někam založíme a tato „nepodstatná data” už nikdy nespatří světlo světa. Nyní si představte, že jste jiný vědec, zkoumající nějakou závažnou chorobu. Vedlejší data z výše zmíněného výzkumu o bakteriích by mohla významně přispět k objevení způsobu léčby této choroby, ale smůla – data nejsou k dispozici. Tato analogie ilustruje jeden z důvodů důležitosti efektivního plánování správy dat – tzv. „data stewardship”.

Veřejní poskytovatelé financí dnes již vyžadují po každém výzkumu plán správy dat, jehož sestavení je mnohými vnímáno jako „otravná povinnost”. To mění projekt Data Stewardship Wizard (DSW), který má na svědomí tým z Fakulty informačních technologií ČVUT pod vedením doc. Ing. Roberta Pergla, Ph.D. Tento open-source softwarový nástroj, financovaný z evropských i národních zdrojů, uživatele intuitivně a jednoduše provede celým procesem sestavení plánu správy dat, který bude co nejlépe splňovat normy stanovené iniciativou FAIR: Data by měla být dohledatelná (Findable), přístupná (Accessible), interoperabilní (Interoperable) a znovu použitelná (Reusable). FAIR si tedy můžeme představit jako nějakou „best practice”.

„Principy FAIR podstatným způsobem zlepšují možnosti znovupoužitelnosti dat, zejména s ohledem na propojování dat mezi sebou navzájem, například spojení dat klinických studií léků s výzkumem genetiky. Efektivní využívání dat na globální úrovni je též klíčové pro účinné řešení epidemiologických situací, což ukázala pandemie COVID-19. V rámci ní jsme se s projektem DSW podíleli na digitalizaci a FAIRifikaci pacientských dat, která je možné využít v dalším výzkumu, a to zcela anonymizovaně,” doc. Ing. Robert Pergl, Ph.D., vedoucí Centra pro konceptuální modelování a implementace (CCMi) na FIT ČVUT.

DSW neumožňuje pouze plán správy dat vytvořit, ale také učí, jak správně s daty zacházet, udržuje je během projektů a dlouhodobě je distribuuje. Propojuje IT s medicínou, archeologií, školstvím a mnoha dalšími obory. Mezi výhody nástroje bychom mohli rovněž zařadit strojovou zpracovatelnost dat, což je užitečné například pro vývoj umělé inteligence, nebo možnost DSW upravit na míru pro konkrétní specifickou doménu tak, aby „hovořil jazykem” dané problematiky.

„Tento nástroj přináší snadný a účinný způsob, jak vytvářet dobré plány správy dat, vede výzkumníka, pomáhá využít, co je pro výzkum k dispozici, a maximalizovat efekt dat z výzkumu, což přináší hodnotu výzkumníkům, institucím i celé společnosti,“ říká k projektu doc. Robert Pergl.

Příběh DSW se datuje již od roku 2015, kdy se ČVUT připojilo k české větvi ELIXIR – mezinárodní infrastruktuře pro data z přírodních věd, a to ve spolupráci nizozemského uzlu ELIXIR-NL. Tým doc. Ing. Roberta Pergla, Ph.D. se tehdy věnoval vývoji systémů dynamických webových formulářů, což upoutalo pozornost nizozemského vědce – doktora Roba Hoofta a průkopníka iniciativy FAIR – Barenda Monse, který byl v té době hlavou nizozemské větve infrastruktury ELIXIR. Tak vznikl projekt DSW, který je dnes doporučován Evropskou komisí a využíván řadou univerzit a světoznámých výzkumných organizací.

Zajímá vás, jak tento nástroj v praxi funguje? Vžijte se na chvíli do role pilota dopravního letounu. Jak asi tušíte, létání nefunguje tak, že chytíte knipl a letíte. Je třeba nejprve vyplnit takzvaný „pre-flight checklist”, což je seznam jednotlivých funkcí letadla, které jako pilot musíte před samotným letem otestovat. Data Stewardship Wizard si můžeme představit jako kopilota pomáhajícího vám tento seznam správně vyplnit. Funguje jako chytrý dotazník, který vám klade různé otázky ohledně toho, jakým způsobem spravujete data.

[1] Ukázka otázky v DSW

Jednotlivé možnosti odpovědí jsou označeny tagy podle toho, jaký mají vliv na plnění zásad FAIR. Nevíte-li, jak na otázku odpovědět, DSW vám nabídne materiály obsahující podstatné informace vedoucí k rozhodnutí. Po zodpovězení všech otázek nástroj na základě vašich odpovědí vyhodnotí, jak moc FAIR vaše data jsou. Pokládání otázek uvědomí uživatele o aspektech správy dat, které jej do té doby nenapadly, například předcházení zneužitelnosti dat, nebo co dělat, když chce data publikovat. Výsledkem tedy není jen správné vyplnění DMP (Data Management Plan), ale i jeho sestavení.

Foto:
[1] ds-wizard.org