operator ICT

Městská data pro všechny!

V lednu 2020 jsem se sešla s Františkem Hánou a Jiřím Vycpálkem, absolventy Fakulty informačních technologií ČVUT v Praze (FIT), kteří nyní působí v městské firmě Operátor ICT. Tato společnost zajišťuje pro Prahu široké spektrum služeb v oblasti informačních a komunikačních technologií. Jedním z jejích projektů je i datová platforma Golemio

Operator ICT

Na čem vlastně pracujete? O čem se dnes budeme bavit? 

František: Pracujeme na datové platformě Golemio, což je platforma hlavního města Prahy, která má za úkol zpracovávat, transformovat, ukládat a pak nabízet veřejnosti všechna možná data, co se v Praze sbírají. Nabízíme je nejenom veřejnosti, ale často i vedení města, aby mohlo na jejich základě lépe rozhodovat a sledovat, co se ve městě děje.

Kdy projekt vznikl? Jak se na projektu podíleli FIŤáci?

F: Oddělení datové platformy vzniklo v lednu 2017, vlastní vývoj začal na podzim 2018. Na tomhle projektu spolupracují dvě oddělení: oddělení datové platformy a oddělení vývoje. V oddělení vývoje jsou programátoři, kteří dělají v Node.js mimojiné datovou platformu nebo mobilní aplikace jako Moje Praha. Na projektu Datové platformy Golemio pracovali čtyři FIŤáci, a tak jsme se chtěli podělit s FIŤáky o pohled z praxe. 

V čem je zajímavé pracovat tady na platformě? V čem je ten projekt jedinečný?

Jirka: Za nás (oddělení vývoje pozn. redakce) byla datová  platforma největším projektem v minulém roce. Jinak tu děláme i jiné věci, jako třeba Lítačku a vývoj dalších aplikací. Platforma je tedy jen jeden z našich projektů, ale zato ten největší. Proč je to zajímavé? Určitě proto, že jsme měli šanci si postavit něco svého úplně od nuly. Měli jsme šanci udělat to správně, udělat to dobře, prosadit si open source, udělat to tak, aby to bylo pokud možno udržitelné a dělat to z těch správných důvodů za těch správných podmínek, což je dle mého názoru unikátní. A obzvlášť v té městské správě.

F: V komerční sféře to není tak neobvyklé, ale v té státní správě je to něco hodně nového, že by člověk měl používat a víc pracovat s open source nebo sám ho tvořit. To pro nás byla důležitá součást. Další věc je, že jsme to celé stavěli tak, abychom nebyli vendor-lockovaný. Celé to je postavené modulárně, tudíž lze jednotlivé části nahrazovat. Když někomu něco nebude vyhovovat, tak může danou část nahradit jinou při zachování komunikačního rozhraní (interface). To jsou hlavní myšlenky, na kterých jsme to stavěli. Chtěli jsme, aby to byla taková první vlaštovka, vzorový projekt pro další. Chtěli jsme ukázat, že to jde a že to není drahé. Že i v málo lidech se dá za rok udělat spousta dobré práce pro město.

Co bylo nejtěžší při vývoji platformy? Bylo to přesvědčit vedení o tom, že open-source má smysl?

F: Vedení chápalo, proč použít open source má smysl. Problém byl spíš v tom zamyslet se nad právními důsledky následné publikace naší práce – jestli představenstvo může být žalované za to, že zveřejnění kód, který je zaplacený z veřejných peněz. Protože to tady nikdo předtím neudělal, bylo potřeba poradit se se spoustou lidí, jestli to je v pořádku. Tedy nejtěžší bylo řešit ty právní detaily.

J: My jsme to do určité míry museli opravdu prokopávat, protože jsme první firma v takovém postavení, která řešila open source. Víceméně každá jiná firma je buď komerční, nebo čistě státní podnik a oboje má trošku jednodušší situaci než my. My jsme komerční firma, akciová společnost, která má za cíl vydělávat peníze, generovat zisk. Jako u každého jiného produktu ten vývoj stál nějaké peníze a teoreticky bychom ho taky za nějaké peníze mohli prodat. Tím, že jsme ho dali ven jako open source, tak jsme právě museli zdůvodnit to, že to má smysl a že to má objektivní klady, že se to vyplatí. Nejtěžší za mě osobně a za samotný vývoj na produktu bylo to, že nás není tolik, kolik by nás mělo být. A jsou tu i jiné projekty, takže je hodně práce na málo lidí a datová platforma si musela poměrně vydobýt prostor a zdroje, abychom na tom mohli pracovat tak, aby byla opravdu kvalitní.

Jak se dnes ta data dají využívat? Může je využívat kdokoli? Za jakých podmínek?

F: My data publikujeme jako open data, což znamená, že jsou přístupná volně ke stažení, primárně ve formátu CSV, ale pro lepší použití dat v reálném čase nabízíme open API, kde je potřeba se zaregistrovat. Registrace je zdarma, my ji jenom potvrdíme. Tím dostane člověk klíč a může se na API dotazovat na živá data. Nad tím bychom byli rádi, kdyby si lidi pak postavili nějaké aplikace, ať jde o data o poloze vozů nebo o zaplněnosti odpadkových košů nebo cokoliv dalšího. Naším cílem je ta data vytáhnout z města, zpřístupnit je ven a pak aby další subjekty už mohly udělat tu finální aplikaci, to finální zpracování, na které my třeba už nemáme tolik času, protože se chceme soustředit na získávání dalších dat, aby jich bylo víc k dispozici.

Můžou být data i komerčně využívána?

F: Mohou být použita libovolně.

Kdo rozhoduje, jaká data se zpracovávají? Kdo vám zadává projekty?

F: To vychází většinou z projektů, s kým jednáme, protože se snažíme pomáhat městským částem, městským firmám a magistrátu v otevírání dat. Buď přichází někdo s tím, že potřebuje nějaká data zveřejnit, nebo se s nimi bavíme o tom, že by potřebovali udělat nějakou vizualizaci, nějaký dashboard, nějakou business intelligence nad tím. Díky tomu nám ta data zpřístupní a my se pak snažíme, aby bylo možné ještě tato data rovnou zpřístupnit veřejnosti.

Přichází to z různých stran. Určitě když bude mít někdo zájem o nějaká data, může se nám ozvat a my mu třeba řekneme, jestli je reálné je sehnat, nebo jestli už jsme to zkoušeli a je tam neochota z druhé strany.

Jak se dneska data v Praze reálně využívají? Jak daleko jsme v oblasti smart cities jako město?

F: Zatím se data nevyužívají naplno, protože se k nim teprve hledá cesta. Není nastavená data-driven mentalita v rozhodování města. Na druhou stranu cítíme, že jsme oproti jiným městům hodně napřed, že je málo měst, která by už nějakou datovou platformu řešila nebo měla. Jsme na začátku éry, kdy datová politika bude růst, zatím se hledá, co všechno ze současných dat lze zpracovat a zapojit do řízení města. Bude to jenom růst a my chceme být u toho.

J: Myslím si, že se to rozjíždí. I tím, že město i městské organizace a části teď přichází na to, že tu nějaká datová platforma je, že ta data můžou k něčemu použít a že jsou opravdu užitečná. Že můžou na základě toho dělat reálná rozhodnutí, pomalu se to učí a chodí i za námi, že by potřebovali nějaká data nebo analytiky, zpracovat reporty. Začíná to například se zaplněnostmi tříděného odpadu. Tak to je asi modelový use case, kdy městské části používají naše data, která my zpracováváme v datové platformě, máme je ze senzorů o zaplněnosti košů tříděného odpadu. Jsou tam výstupy i vizuální reporty analytiků i ta data. Městské části samotné se na to kouknou a podle toho jsou schopné optimalizovat trasy těch sběrných vozů. Vědí potom, jestli je daný koš vyvážený dostatečně často, nebo jestli je 90 % času plný, takže je potřeba jej vyvážet častěji.

F: Nemůžeme zatím přímo optimalizovat trasy, ty jsou totiž smluvně dané. Data ale slouží jako podklady pro další plánování tras a pro jednání s dodavateli.

Jaké další příklady praktického využití dat dnes jsou a fungují v Praze?

F: Další takovýhle příklad je spolupráce s ROPID, pro které zpracováváme BI reporty, kolik jízdenek se kde prodalo. Kolik čeho, přes jaký kanál, v které časy, pak také sledování mobilní aplikace, jakým způsobem je využívána, například jak často si lidi kupují SMS jízdenku a zda si kupují rovnou dvě, pak pravděpodobně kupují sobě a dítěti. Podle toho pak můžeme nastavit tu aplikaci lépe, aby tam rovnou byla možnost uložit si, že každý den chci kupovat dvě a rovnou na jedno tlačítko. Takhle můžeme zlepšovat i další části produktů.

Další váš projekt je aplikace Lítačka. Ta se tady vyvíjela od nuly. Je to tak?

J: Ta byla součástí multikanálového odbavovacího systému PID Lítačka. Tohle konkrétně bylo dodavatelské řešení. Tu aplikaci jsme si tady celou nevyvíjeli, ale dohlíželi jsme na to z pohledu technického zadání a z pohledu projektového. Bohužel nemůžeme dělat všechno.

 Jaké další projekty tady máte?

J: Tak třeba aplikace Moje Praha. Tu tady máme kompletně interně. Tam si člověk může zobrazit spoustu dat právě z datové platformy, je to takový frontend k datové platformě. Uživatel v ní může zaplatit za parkování v placené zóně, zobrazí si parkoviště atd. Máme i různé menší projekty, třeba aplikaci Změňte to. To je aplikace, kde lidi můžou nahlásit nějaký problém, třeba rozbité světlo nebo vrak, který překáží, vyfotit, odeslat a pak se to nějakým způsobem zpracovává. Také tu dnes spravujeme Lítačku a vývoj nad Lítačkou, co se týká správy karty, třeba objednávky, online objednávky, žádosti a třeba API nad tím. Dále tu děláme menší věci, různé weby pro naší projektovou kancelář Smart Prague.

Chystá se větší projekt s datovou platformu? Na co se můžeme od vás těšit?

F: Teď jednáme s TSK (Technická správa komunikací) o dopravních datech, jak zpracovávat a víc využívat data z různých datových zdrojů. Máme data od společnosti Waze, máme floating car data, pak máme detektory u křižovatek, které počítají, kolik aut tudy projelo. A všechna tahle data bychom chtěli dát dohromady a vytvořit společnou mapu průjezdnosti Prahy. Pracujeme také na business intelligence pro Prahu ve smyslu Praha v datech, ale je ještě příliš brzy na to, abychom mohli říci, jak velký to bude projekt. Jeden takový větší projekt, který by nás mohl čekat, je také zatím ještě v zárodku. Je to portál otevřených dat. Aktuálně takový portál máme, ale přichází k nám hodně informací o tom, že je špatně použitelný, nepřehledný a že nebude do budoucna splňovat mezinárodní standardy. Ten by se potenciálně nahradil novým portálem, který by byl asi vyvíjen ve spolupráci s Ministerstvem vnitra, kde také něco obdobného řeší. Ale to je úplně v plenkách.

J: Co se ještě chystá ohledně datové platformy, tak za nás je to rozvoj nových věcí a nových funkcionalit, nových dat, ale i rozvoj toho produktu jako takového, té platformy jako softwaru. Chceme ten samotný software v tomto roce v rámci open-source posouvat dál. Chceme ten nástroj upravit tak, aby byl ještě více univerzální, aby opravdu bylo oddělené jádro tak, aby to bylo použitelné pro další města jednodušeji, než tomu je nyní. Aby si mohl někdo v Brně říct, že chce použít stejnou datovou platformu, kterou mají v Praze, aby si to mohl jednoduše stáhnout a nasadit. Nějakým způsobem už to jde teď a my jsme na to připraveni, ale chceme to posouvat dál tímto směrem. Kromě Golemia se pak za operátora chystá například rozšíření systému PID Lítačka na krátkodobé jízdenky a na kupony na kartách atd. do Libereckého kraje. Chceme, aby ten systém byl propojený i se Středočeským krajem a Prahou.

Takže si budu moci koupit v jednom systému jednu jízdenku z Prahy do Liberce?

F: Takový je plán. Ještě to samozřejmě není hotové a nemám přehled o tarifních pravidlech, jestli to bude úplně umožněno, ale minimálně technicky by ten systém měl být stejný, takže alespoň na tu stejnou kartu, platební nebo jinou, a pod stejným účtem si ten člověk nahraje kupón, který mu platí po Libereckém kraji, i kupón, který mu platí po Praze, a bude se odbavovat stejnou kartou. To je nějaký výhled do budoucna na tento rok. V tuhle chvíli ještě nevím, do jaké míry se na tom jako interní vývoj budeme podílet. Těch projektů je tady hodně.

J: Stejná situace je s projektem Portál Pražana. To je další projekt, který tady vzniká a je v plánu ho mít tenhle rok hotový.

O čem to je?

J: To by měl být portál pro digitální styk občana s úřadem, s městem. Občan se tam přihlásí e-identitou a může si tam vyřídit různé věci online, aniž by musel na ten úřad fyzicky. Plán je samozřejmě ten portál co nejvíc rozvíjet a rozšiřovat, aby tam přibývaly další a další agendy, které si člověk vyřídí, aniž by musel někam chodit. Na začátku se plánují základní agendy jako registrace odpadů, registrace psů apod.

Je to v plánu pro celou Prahu nebo jen pro městské části?

F: Plánujeme to pro celou Prahu, děláme to pro magistrát. Opět ještě úplně nevíme, do jaké míry se my jako interní vývoj na tom budeme podílet, jestli stoprocentně nebo jestli to bude částečně řešeno dodavatelsky, ale určitě to bude během tohohle roku.

Bylo by možné tento systém rozšířit na celou Českou republiku ve chvíli, kdy k tomu bude politická vůle?

F: Systém vychází právě z Portálu občana, který už existuje. Takže se naopak kód Portálu občana používá pro Portál Pražana, takže opačným směrem, ale ano. Měl by pak být do budoucna společný vývoj právě těch identit nebo společných agend, aby bylo možné používat stejné moduly.

Napadají vás osobně nějaké projekty s městskými daty, které byste třeba rádi viděli? Vy víte nejlépe, jaká data máte.

F: Mně by se moc líbilo, kdybychom měli data z těch jezdících autíček Eltodo, která sledují zaplněnost ulic a jestli auta, která tam stojí, mají zaplacené parkování na daném místě. Mohli bychom pak mnohem lépe analyzovat, kdo tam parkuje. Jestli jsou to lidé ze Středočeského kraje nebo rezidenti, které ulice jsou volné, tudíž se tam dá zaparkovat. Celkově by bylo skvělé lépe optimalizovat parkování.

J: Parkování a doprava celkově je obrovské téma a velký problém, takže tam asi jakýkoliv další datový projekt bude určitě užitečný. Je ale otázka, jestli ten výstup z toho nebude vždycky ten, že máme málo parkovišť a musíme stavět a nic jiného se s tím neudělá. Tohle by ale určitě bylo zajímavé, mít data o autech co v Praze parkují, od rezidentů i data o krátkodobých parkováních.

F: Další velké téma je teď klima, takže jsme dělali například projekt Zelené střechy, kde se počítalo, kolik střech v Praze by mohlo být zelených na základě toho, jestli jsou ploché, jaký mají sklon a tak podobně. 

Došlo to tak daleko, že by se opravdu na základě těch dat začaly budovat nebo aspoň plánovat zelené střechy někde?

F: Nevím, ta anaýza vyšla asi před rokem, rokem a půl a já jsem pak o tom projektu už neslyšel, jak pokračoval.

J: Tohle jsou určitě dobré projekty, zelené střechy. Další zajímavá věc byla analýza dat z Airbnb, kterou dělala datová platforma. A to si myslím, že je zajímavé a důležité, aby se tyhle analýzy dělaly a aby se rozhodovalo na základě dat. Aby se pak nerozhodovalo a nehlásaly se věci podle toho, co lidé myslí, aby se tyto věci nedělaly pocitově. Aby se neříkalo jen ‚Airbnb nám ničí město‘ nebo ‚Airbnb je úplně v pohodě‘, aniž by to bylo podložené nějakými daty. Myslím si, že tohle je důležité pro skoro každý problém.

Jsou ty analýzy potom opravdu třeba i politicky využité, nebo se stává, že se něco analyzuje, ta data jsou, ale pak se odloží a nepoužijí?

F: Zatím ještě pořád budujeme mentální nastavení na to, využívat ta data pro reálné rozhodování a ne vždy se podaří dostat ke všem lidem, kteří daný problém pak řeší nebo o něm rozhodují. Ale snažíme se o to, aby se to k těm lidem dostalo. A třeba ve chvíli, kdy vyjde nějaká analýza, která říká něco jiného než máme v datech, tak my pak vezmeme ta naše data a říkáme: Hele podívejte se, tady jste měli tyhle nepřesnosti, zkuste se na to podívat ještě z tohoto úhlu

Asi poslední otázka je, co byste chtěli vzkázat čtenářům, co si myslíte, že tu nezaznělo a mělo?

F: Já bych chtěl říci, proč by se člověk z FITu měl přijít k nám podívat nebo třeba i pracovat. Za prvé, kdokoliv se nám může ozvat, přijít se podívat na to, co děláme, jsme světu otevření. Já si myslím, že pro lidi by mohlo být zajímavé vidět, jak se opravdu dělá IT v městské správě. Snažíme se to dělat správně a myslím si, že spousta lidí dokáže kritizovat, chceme jim proto nabídnout možnost se podívat, jak to reálně funguje.

J: Tady je šance, kterou málokdo opravdu využije, šance opravdu jít a něco reálně udělat, pomoci a opravdu se podílet na něčem, co má reálný dopad, a mít podíl na tom, aby se to dělalo správně a aby se to dělalo otevřeně, aby se to dělalo tak, jak se to dělat má. Jak jsem říkal na začátku, snažíme se to tu dělat ze správných důvodů tak, aby tady nezůstaly systémy z devadesátých let, tak, aby tady nebyly vendor-locky. Chceme lidem ukázat, že i v městské správě je snaha. Myslím si, že je to jako cenná šance a možnost se podílet na něčem reálném.

F: A určitě jsme otevření i diskuzi nad bakalářkami, seminárkami i stážemi. Zkuste se nám ozvat, ne vždycky na to asi bude prostor, ale když to nezkusíte, tak to nezjistíme. Tím, že máme většinu dat veřejných, tak se dají použít i bez nás, ale když s tím někdo bude chtít pomoct, tak my mu rádi řekneme další věci okolo a třeba vymyslíme zajímavější use case, aby člověk třeba nedělal zbytečnou práci.

J: Mě ještě napadlo něco, co tu možná nepadlo úplně explicitně. Datová platforma je open source, takže se na to kdokoliv může podívat – jak to máme napsané, v čem to máme napsané, jestli to máme dobře, co by třeba ten někdo udělal lépe, nebo jestli to naopak je v pohodě. Pro nás to bude cenné a pro ty lidi to může být zajímavé.

Můžou nahlašovat issues někde na gitu?

F: Přesně tak, můžou nahlašovat issues na GitLabu

J: Můžou a budeme rádi! Čím víc lidí se na to podívá, tím líp. K tomu ten open-source je. Zároveň si myslím, že na tom uvidí, že se to tady snažíme dělat moderně a správně, že to není klasický korporátní kód.

Tak to bylo za mě vše! Děkuju moc za rozhovor! 

F + J: Taky děkujeme!

Operátor ICT spolupracuje mimo jiné s fakultní OpenDataLab. OpenDataLab je otevřená laboratoř založená ve spolupráci s FIT. Je určena hlavně pro studenty, ale po domluvě mohou přijít i další lidé. 

Lucie Procházková

Na FITu jsem už čtvrtým rokem a jelikož mě kromě IT baví i jiné činnosti, jako například psaní, tak jsem se octla i v redakci. Pokud neťukám do klávesnice, ťukám do klaviatury, brnkám na kytaru nebo něco organizuji - převážně v Czechitas anebo v organizaci YMCA Kontaktovat mě můžete na prochl10@fit.cvut.cz.