Odpovědí na tuto otázku se zabývá 30. díl fakultního technologického podcastu FIT ČVUT Jedničky a Nuly a náš poslední článek. K jakým chybám může docházet při vizualizaci dat a jak jim předcházet? Jak se dá s daty manipulovat a jak je dobře číst? O tom všem s Ing. Magdou Friedjungovou, Ph.D., členkou Katedry aplikované matematiky FIT ČVUT.
Co je to vizualizace dat?
„Pokud chceme vytvořit model, který dokáže dobře předpovídat, potřebujeme mnoho kvalitních dat. Nejdůležitější je jejich samotná příprava. Nejprve je musíme dostat do stejného formátu, doplnit chybějící hodnoty a také zajistit, aby těch záznamů a měření, na základě kterých můžeme usuzovat, bylo dostatek. Je to pracný proces, díky němuž potom dokážeme vytěžit co nejvíce,“ vysvětluje Magda Friedjungová v podcastu a dodává:
„V dnešní době jsme obklopeni nepřeberným množstvím dat a máme potřebu z nich získávat nějaké informace. Vizualizace může být dobrým nástrojem, jak ta data poznat, jak jim porozumět a jak je efektivně komunikovat. Náš mozek je totiž velmi dobrý ve vizuálním vnímání a je schopný takhle zpracovaná data efektivně přeložit a pochopit je.“
Odbornice na vizualizaci dat, Ing. Magda Friedjungová, Ph.D.
Do problematiky vizualizace dat vás v podcastu zasvětí Ing. Magda Friedjungová, Ph.D., členka Katedry aplikované matematiky FIT ČVUT. Po humanitním bakaláři se rozhodla pokračovat rovnou na magistra v oboru Znalostní inženýrství. Pracovala jako vedoucí testerů ve společnosti Ataccama a na FIT se zapojila do projektu, který se zabýval návrhem datového skladu ČVUT. Na magisterské studium navázala studiem doktorským, které po čtyřech letech úspěšně dokončila. Ve své disertační práci se zabývala transfer learningem a pokročilými metodami předzpracování dat. Nyní pracuje jako odborný asistent na KAM, kde vyučuje předměty zaměřené na strojové učení a business intelligence, vede tým vývojářů datového skladu ČVUT, je vedoucí Laboratoře datových věd (DataLab) a garantkou předmětu Vizualizace dat (BI-VIZ), který je povinný pro bakalářskou specializaci Umělá inteligence.
Nevěřte všemu, co vidíte – aneb co to znamená vizualizace dat?
„Během vizualizace dat se můžeme dopustit nejrůznějších chyb, ať už záměrně nebo nezáměrně. Asi nejčastější chybou, se kterou se často setkáváme na politické scéně, je tzv. usekávání osy y, které zkresluje naše vizuální vnímání. Rozdíly, které takový graf demonstruje, se potom zdají větší, než ve skutečnosti jsou. Pokud se toho dopustíme záměrně, například z důvodu úspory místa, je třeba o tom čtenáře či diváky informovat. Další způsob manipulace s daty je tzv. cherry picking, kterého se často dopouštějí novináři. To znamená, že se pro účely vizualizace nepoužila všechna data, ale pouze jejich výňatek, protože je zajímavý a snaží se vyvolat senzaci. Proto musíme při práci s daty používat kritické myšlení a přemýšlet nad tím, zda pocházejí od důvěryhodných zdrojů. Vizualizace nám mohou pomoci lépe datům porozumět, ale musí být vytvořeny správně,“ vysvětluje Magda Friedjungová v podcastu.
Jaké další metody se využívají pro zpracování a vizualizaci dat? Poslechněte si nový díl podcastu. Všechny díly vždy najdete ve svých oblíbených podcastových aplikacích.
O podcastu
Cílem podcastu Jedničky a Nuly je přiblížit nejnovější informační technologie široké veřejnosti a přispět tak k popularizaci oboru, který je v dnešní době v mnoha oblastech nepostradatelný. Zajímá vás bezpečnost, umělá inteligence, drony, IT v astronomii nebo kamery ve veřejném prostoru? Poslechněte si i předchozí díly:
Proč programovat bezpečně? – 10. 3. 2024
Jak rozpoznat hrozby v šifrovaném provozu? – 10. 1. 2024
Proč je Wikipedie tak úspěšná? – 10. 12. 2023
Jak se monitoruje síťový provoz? – 10. 11. 2023
Jak je složité si vytvořit vlastní počítačovou hru? – 10. 10. 2023
Jak využívat umělou inteligenci bezpečně? – 10. 9. 2023
Jak se dá IT využít k tvorbě hudby? – 10. 8. 2023
Jak jsem zvládl prvák na FIT ČVUT? – 10. 7. 2023
Jak se používají superpočítače? – 10. 6. 2023
Co mají společného Platón a technologie? – 10. 5. 2023
Jak se modelují exoplanety? – 10. 4. 2023
Jak fungují doporučovací systémy? – 10. 3. 2023
Přístupové karty – jejich výhody a rizika? – 10. 2. 2023
K čemu jsou nám superpočítače? – 10. 1. 2023
Jak počítačově simulovat chování lidí? – 10. 12. 2022
Jak se žije v době datové? – 10. 11. 2022
Veřejná data – hrozba, nebo příležitost? – 10. 10. 2022
Proč je matematika důležitá pro informatiku? – 10. 9. 2022
Jak zařídit, aby mi dal lajk Elon Musk? – 10. 8. 2022
Jak se ze školní lavice dostat až do kanceláře děkana? – 10. 7. 2022
Jak virtuální realita může přiblížit minulost? – 10. 6. 2022
Jak algoritmy doporučují obsah na internetu? – 10. 5. 2022
Jaká jsou rizika při používání stejných hesel? – 10. 4. 2022
Jsou auta plná moderních technologií bezpečná? – 10. 3. 2022
Jak se dá umělá inteligence využít při pozorování vesmíru? – 10. 2. 2022
Mohou roboti nahradit lidi ve skladech? – 10. 1. 2022
Proč se nebát kamer ve veřejném prostoru? – 10. 12. 2021
Dokážeme žít bez umělé inteligence? – 10. 11. 2021
Kdy nám budou drony doručovat nákupy? – 10. 10. 2021
Na další otázky ze světa jedniček a nul vám odpoví odborníci z FIT ČVUT společně se Sarou Polak vždy jednou měsíčně. A kde si můžete podcast poslechnout? Naleznete ho na stránkách fit.cvut.cz/podcast, nebo v aplikacích Spotify, Google Podcasts a Apple Podcasts pod názvem Jedničky a Nuly.