Nevěřte všemu, co vidíte – aneb co to znamená vizualizace dat?

Odpovědi se vám dostane ve 30. díle technologického podcastu FIT ČVUT Jedničky a Nuly a našem posledním článku doprovázejícím tento fakultní podcast. K jakým chybám může docházet při vizualizaci dat a jak jim předcházet? Jak se dá s daty manipulovat a jak je dobře číst? O tom všem s Ing. Magdou Friedjungovou, Ph.D., členkou Katedry aplikované matematiky FIT ČVUT.

Co je to vizualizace dat?

„Jestliže chceme vytvořit model, který dokáže dobře předpovídat, potřebujeme mnoho kvalitních dat. Nejdůležitější je jejich samotná příprava. Nejprve je musíme dostat do stejného formátu, doplnit chybějící hodnoty a také zajistit, aby těch záznamů a měření, na základě kterých můžeme usuzovat, bylo dostatek. Je to pracný proces, díky němuž potom dokážeme z dat získat co nejvíce,“ vysvětluje Magda Friedjungová v podcastu a dodává:

„V dnešní době jsme obklopeni nepřeberným množstvím dat a máme potřebu z těchto dat získávat nějaké informace. Vizualizace může být dobrým nástrojem, jak ta data poznat, jak jim porozumět a jak je efektivně komunikovat. Náš mozek je totiž velmi dobrý ve vizuálním vnímání a je schopný takhle zpracovaná data efektivně přeložit a pochopit je.“

Odbornice na vizualizaci dat, Ing. Magda Friedjungová, Ph.D.

Do problematiky vizualizace dat vás v podcastu zasvětí Ing. Magda Friedjungová, Ph.D., členka Katedry aplikované matematiky FIT ČVUT. Po humanitním bakaláři se rozhodla pokračovat rovnou na magistra v oboru Znalostní inženýrství. Získala první zaměstnání v oboru jako vedoucí testerů ve společnosti Ataccama a na FIT se zapojila do projektu, který se zabýval návrhem datového skladu ČVUT. Na magisterské studium navázala studiem doktorským, které po čtyřech letech úspěšně dokončila. Ve své disertační práci se zabývala transfer learningem a pokročilými metodami předzpracování dat. Zůstala zde po všech studiích pracovat jako odborný asistent na KAM, kde vyučuje předměty zaměřené na strojové učení a business intelligence, vede tým vývojářů datového skladu ČVUT, je vedoucí Laboratoře datových věd (DataLab) a garantkou předmětu Vizualizace dat (BI-VIZ), který je povinný pro bakalářskou specializaci Umělá inteligence.

Nevěřte všemu, co vidíte – aneb co to znamená vizualizace dat?

„Během vizualizace dat se můžeme dopustit nejrůznějších chyb, ať už záměrných nebo nezáměrných. Asi nejčastější chybou, se kterou se často setkáváme na politické scéně, je tzv. usekávání osy y, které zkresluje naše vizuální vnímání. Rozdíly, které takový graf demonstruje, se potom zdají větší, než ve skutečnosti jsou. Pokud se toho dopustíme záměrně, například z důvodu úspory místa, je třeba o tom čtenáře či diváky informovat. Další způsob manipulace s daty je tzv. cherry picking, kterého se často dopouštějí novináři. To znamená, že se pro účely vizualizace nepoužila všechna data, ale pouze jejich výňatek, protože je zajímavý a snaží se vyvolat senzaci,“ vysvětluje v podcastu Magda Friedjungová a dodává:

„Při práci s daty je třeba kritického myšlení. Musíme si položit otázku, jestli je každý bude interpretovat tak, jak očekáváme. Pokud například využíváme barevnou škálu, měli bychom zvážit, jaký způsob použití je nejvíce vhodný a intuitivní. Čtenář nebo divák by měl naproti tomu přemýšlet nad tím, zda ta data pocházejí od důvěryhodných zdrojů. Vizualizace nám mohou pomoci lépe datům porozumět, ale musí být vytvořeny správně.“

Jaké další metody se využívají při zpracování a vizualizaci dat? Poslechněte si nový díl podcastu. Všechny díly vždy najdete ve svých oblíbených podcastových aplikacích.

O podcastu

Cílem podcastu Jedničky a Nuly je přiblížit nejnovější informační technologie široké veřejnosti a přispět tak k popularizaci oboru, který je v dnešní době v mnoha oblastech nepostradatelný. Zajímá vás bezpečnost, umělá inteligence, drony, IT v astronomii nebo kamery ve veřejném prostoru? Poslechněte si i předchozí díly:

Proč programovat bezpečně? – 10. 3. 2024
Jak rozpoznat hrozby v šifrovaném provozu? – 10. 1. 2024
Proč je Wikipedie tak úspěšná? – 10. 12. 2023
Jak se monitoruje síťový provoz? – 10. 11. 2023
Jak je složité si vytvořit vlastní počítačovou hru? – 10. 10. 2023
Jak využívat umělou inteligenci bezpečně? – 10. 9. 2023
Jak se dá IT využít k tvorbě hudby? – 10. 8. 2023
Jak jsem zvládl prvák na FIT ČVUT? – 10. 7. 2023
Jak se používají superpočítače? – 10. 6. 2023
Co mají společného Platón a technologie? – 10. 5. 2023
Jak se modelují exoplanety? – 10. 4. 2023
Jak fungují doporučovací systémy? – 10. 3. 2023
Přístupové karty – jejich výhody a rizika? – 10. 2. 2023
K čemu jsou nám superpočítače? – 10. 1. 2023
Jak počítačově simulovat chování lidí? – 10. 12. 2022
Jak se žije v době datové? – 10. 11. 2022
Veřejná data – hrozba, nebo příležitost? – 10. 10. 2022
Proč je matematika důležitá pro informatiku? – 10. 9. 2022
Jak zařídit, aby mi dal lajk Elon Musk? – 10. 8. 2022
Jak se ze školní lavice dostat až do kanceláře děkana? – 10. 7. 2022
Jak virtuální realita může přiblížit minulost? – 10. 6. 2022
Jak algoritmy doporučují obsah na internetu? – 10. 5. 2022
Jaká jsou rizika při používání stejných hesel? – 10. 4. 2022
Jsou auta plná moderních technologií bezpečná? – 10. 3. 2022
Jak se dá umělá inteligence využít při pozorování vesmíru? – 10. 2. 2022
Mohou roboti nahradit lidi ve skladech? – 10. 1. 2022
Proč se nebát kamer ve veřejném prostoru? – 10. 12. 2021
Dokážeme žít bez umělé inteligence? – 10. 11. 2021
Kdy nám budou drony doručovat nákupy? – 10. 10. 2021

Na další otázky ze světa jedniček a nul vám odpoví odborníci z FIT ČVUT společně se Sarou Polak vždy jednou měsíčně. A kde si můžete podcast poslechnout? Naleznete ho na stránkách fit.cvut.cz/podcast, nebo v aplikacích Spotify, Google PodcastsApple Podcasts pod názvem Jedničky a Nuly.

Magdaléna Malířová

Věřím, že studium vysoké školy nabízí víc než jen nové znalosti, proto se ráda aktivně podílím na životě na naší fakultě. Jsem členkou studentského klubu FIT++, kde pomáhám s organizováním nejrůznějších akcí. A protože mě kromě psaní kódu baví i psaní článků, stala jsem se také součástí redakčního týmu fakultního časopisu Buď FIT. Ve volném čase ráda kreslím, cestuju a hraju v divadle. Jako členku divadelního souboru Comica Economica jste mě mohli vidět například na prknech Semaforu. Kontaktovat mě můžete na malirmag@fit.cvut.cz.