Tuto otázku pokládá čtrnáctý díl technologického podcastu FIT ČVUT Jedničky a Nuly. Tentokrát vám vysvětlí, jakým způsobem za sebou lidé data zanechávají, co jsou to FAIR data a k čemu slouží data management plan. Moderátorka podcastu Sara Polak vyzpovídala vědeckého odborníka z Centra pro konceptuální modelování a implementace (CCMi), doc. Ing. Roberta Pergla, Ph.D.
Co jsou to FAIR data?
„Když jsem pobýval v Holandsku, narazil jsem se svými kolegy na iniciativu FAIR, která si klade za cíl zlepšit dostupnost dat, která na světě jsou, a také to, aby se ta data dala lépe využít a také lépe strojově zpracovat. Tahle myšlenka mě nadchla,“ vypráví doc. Robert Pergl v podcastu.
Formované FAIR principy vznikly v roce 2016 a jejich zkratka znamená:
F – findability (nalezitelnost): data by měla být snadno dohledatelná jak pro lidi, tak pro počítače.
A – accessibility (dostupnost): data by měla být přístupná, což nutně neznamená otevřená. Neplatí, že k nim všichni musí mít přístup, například klinická data z principu nemůžou být otevřená, ale minimálně se musí vědět, že existují. Jakmile uživatel najde požadovaná data, musí vědět, jak k nim lze získat přístup, případně včetně autentizace a autorizace. Zlaté pravidlo zní: tak otevřená, jak je možné, tak uzavřená, jak je třeba.
I – interoperability (interoperabilita): data by měla být propojitelná s jinými daty. Kromě toho musí spolupracovat s aplikacemi nebo pracovními postupy pro analýzu, ukládání a zpracování.
R – reusability (opětovné použití): data by měla být znovupoužitelná. Aby toho bylo dosaženo, měla by být dobře popsána, aby je bylo možné replikovat a kombinovat v různých prostředích. Proto je potřeba, aby byl dobře popsán jejich formát, aby bylo jasné, co v nich je a co to znamená.
Odborník na FAIR data, doc. Ing. Robert Pergl, Ph.D.
Sociální sítě, chytré domácnosti, vědecké experimenty… Jakým způsobem za sebou lidé data zanechávají, co jsou to FAIR data a k čemu slouží data management plan vám v podcastu prozradí doc. Ing. Robert Pergl, Ph.D., zakladatel a vedoucí Centra pro konceptuální modelování a implementace (CCMi) na Katedře softwarového inženýrství FIT ČVUT. Kromě toho je také vedoucím řešitelského týmu na projektech ELIXIR CZ, českého národního uzlu podílejícího se na evropské výzkumné infrastruktuře pro biologická data, do kterého se zapojil v roce 2015. Jedním z jeho hlavních cílů je lépe zpracovávat a využívat velké množství dat. Zatím nejaktivnější je právě jeho pracoviště skrze portál Data Stewardship Wizard, jehož vývoj řídil.
Jak se žije v době datové?
„Množství dat, které dneska na zemi je, je v řádu zettabajtů. Data vznikají aktivitou lidí, aktivitou zařízení (IoT) a taky aktivním sběrem, měřením, experimenty apod. Vědecká data jsou nejzajímavější a nejdůležitější pro společnost, protože se v nich skrývá obrovské bohatství. Tohle bohatství zatím bohužel nevyužíváme zdaleka tak moc a tak dobře, jak bychom měli. A právě to se snažíme zlepšit,“ vysvětluje doc. Robert Pergl v podcastu a dodává: „Říká se, že data jsou ropou 21. století. Dat je k dispozici nepřeberné množství, ale je potřeba je lépe zpřístupnit pro využívání.“
Jak vylepšuje strojové zpracovávání dat, v čem vidí největší benefit sběru dat nebo k čemu je data management plan? Odpovědi na tyto a mnohé další otázky vám prozradí v podcastu.
O podcastu
Cílem podcastu Jedničky a Nuly je přiblížit nejnovější informační technologie široké veřejnosti a přispět tak k popularizaci oboru, který je v dnešní době v mnoha oblastech nepostradatelný. Zajímá vás umělá inteligence, archeologie v AI, matematika v IT nebo otevřená data? Poslechněte si předchozí díly:
Veřejná data – hrozba, nebo příležitost? – 10. 10. 2022
Proč je matematika důležitá pro informatiku? – 10. 9. 2022
Jak zařídit, aby mi dal lajk Elon Musk? – 10. 8. 2022
Jak se ze školní lavice dostat až do kanceláře děkana? – 10. 7. 2022
Jak virtuální realita může přiblížit minulost? – 10. 6. 2022
Jak algoritmy doporučují obsah na internetu? – 10. 5. 2022
Jaká jsou rizika při používání stejných hesel? – 10. 4. 2022
Jsou auta plná moderních technologií bezpečná? – 10. 3. 2022
Jak se dá umělá inteligence využít při pozorování vesmíru? – 10. 2. 2022
Mohou roboti nahradit lidi ve skladech? – 10. 1. 2022
Proč se nebát kamer ve veřejném prostoru? – 10. 12. 2021
Dokážeme žít bez umělé inteligence? – 10. 11. 2021
Kdy nám budou drony doručovat nákupy? – 10. 10. 2021
Na další otázky ze světa jedniček a nul vám odpoví odborníci z FIT ČVUT společně se Sarou Polak vždy jednou měsíčně. A kde si můžete podcast poslechnout? Naleznete ho na stránkách fit.cvut.cz/podcast, nebo v aplikacích Spotify, Google Podcasts a Apple Podcasts pod názvem Jedničky a Nuly.