Pavel Kordík: Praha jako centrum umělé inteligence? Všichni musíme táhnout za jeden provaz.

Aktuálním tématem časopisu je Umělá inteligence a s kým jiným si o tom popovídat než s Pavlem Kordíkem, jednou z hlavních tváří výuky a výzkumu umělé inteligence na FIT ČVUT.

doc. Ing. Pavel Kordík, Ph.D. je proděkan pro spolupráci s průmyslem. Na FITu vyučuje Metody výpočetní inteligence (NI-MVI) a Algoritmy data miningu (NI-ADM). Podílel se na vzniku startupů RecombeeUNICO.ai. Je jedním ze zakládajících členů iniciativy prg.ai. Celý vědecký život ho provází neuronové sítě, jejich optimalizace a rekomendační systémy.

Anička: Na začátek na vás máme takovou klasickou otázku. Jak jste se dostal k umělé inteligenci a kde jste ji studoval? Na FELu?

K umělé inteligenci jsem se dostal, ještě když jsem studoval na střední škole ve Vimperku, a to tak, že jsem si ve volném čase programoval vlastní verzi DUNE II realtimové strategie a potřeboval jsem nějak vyřešit inteligenci tanků ve hře. A tehdy jsem zjistil, že se na to dá jít i chytře, a začetl jsem se do knížky Neuronové sítě a neuropočítače od Mirka Nováka. Ta mě ale nadchla tak, že jsem postupně úplně ztratil zájem o hru samotnou a zabýval jsem se už jen tím, jak v ní udělat umělou inteligenci. To jsem byl někdy ve druháku, třeťáku. Pak jsem se přihlásil právě na informatiku na FEL, abych umělou inteligenci studoval pořádně.

Dodnes si pamatuji, jak jsem tehdy na FEL čerstvě nastoupil a odevzdával první semestrálku z nějakého programovacího předmětu, v rámci které jsem si naprogramoval vlastní neuronovou síť. Byl jsem na ni tenkrát hrozně hrdý, protože obsahovala hypersynapse a bůhvíco ještě, a když jsem to odevzdal cvičícímu Pavlu Náplavovi, o kterém jsem věděl, že se taky zabývá neuronovými sítěmi, tak jsem si říkal: „Ten mě určitě pochválí.“ Ale on mi řekl: „Hezký, ale k čemu je to dobrý?“ (smích) A já si uvědomil, že vlastně k ničemu. Že jsem pracoval na nějakých strukturách, které třeba trochu napodobují lidský mozek, ale nemělo to reálně žádný cíl. A od té doby jsem se vždycky i v rámci studia snažil víc věnovat věcem, které mají nějaký cíl a někde reálně pomůžou.

Anička: Když ještě zůstaneme u těch studií – Vy jste dokončil školu a potom jste si musel říkat: „Co dál, co budu dělat teď?“ Šel jste pracovat do nějakého startupu, do firmy? Nebo už jste začal pracovat při škole?

Já jsem zjistil, že jsem prakticky trochu nezaměstnatelný. Protože když jsem si při škole snažil najít brigádu v softwarové firmě a u pohovoru mi nabídli, co bych u nich mohl dělat, tak jsem jim místo toho navrhnul, jestli bych nemohl dělat něco trochu jiného, že by to pro ně jako pro firmu mohlo být zajímavé a mě by to bavilo. A u pohovoru se se mnou rychle rozloučili. (smích) Nakonec jsem se rozhodl zůstat na škole i na doktorské studium, protože jsem tam byl spokojený, měl jsem volnost a nepotřeboval jsem nějak extra vydělávat peníze. Takže jsem učil, trochu bádal a nějaký byznys přišel až později. V té době jsme ale taky měli trochu jiné možnosti, než máte vy. Za nás se ještě moc nevědělo, co to nějaký startup vůbec je.

Kristýna: Jeden startup jste pak taky spoluzaložil, Recombee, který se zabývá rekomendačními systémy. Jaká byla vaše cesta od vědy k byznysu?

Na škole je skvělá ta svoboda, kdy si člověk může v podstatě zkoumat co chce, i kdyby to třeba nikdy nikdo nepoužil. Ale tím, jak jsem už na škole byl dlouhá léta, tak mi přece jenom trochu začalo chybět, že ty věci, které dělám, nejsou víc použitelné v praxi. Protože člověk může být excelentní, hodně citovaný vědec, k takovým lidem mám velký respekt a úctu, ale aby to člověk dokázal, tak tomu musí věnovat obrovské množství času a energie. A to je těžké. Takových lidí je velmi málo. A když člověk napíše článek a má sem tam nějakou citaci, tak ho to někdy malinko nebaví.

Já si myslím, že jsem ve vědě vždycky dělal dobré věci, akorát jsem o tom nedokázal přesvědčit vědeckou komunitu. Třeba meta learning, který teď začal trendovat díky marketingové mašinerii Googlu, jsem dělal už před 15 lety. Když se kouknete na moje články, tak jsem vždycky ty věci dělal o 10, 15 let dřív, než přišly do módy.

Kristýna: Takový Jára Cimrman umělé inteligence.

No. (smích) A tak jsem teda začal pátrat po někom, kdo by ty moje nápady vzal a zkomercializoval. Vytvořil z nich třeba nějakou tu firmu.

Anička: A našel jste?

Nenašel. Zjistil jsem, že se to úplně nedá takhle jednoduše někomu předat, a tak jsem začal hledat jiné možnosti. Zároveň mi můj bývalý školitel Mirek Šnorek hodně otevřel oči v tom, jak moc důležité je umět najít dobré lidi a s těmi pracovat. Snažil jsem se tedy na školu přitáhnout dobré doktorandy a udržet je. Ale udržet šikovného doktoranda je poměrně těžká věc, když na ČVUT ti doktorandi tenkrát brali 5 000 Kč měsíčně a v práci dostali 50 000 Kč. Tak jsem přemýšlel, jak to vyřešit, a založili jsme nejdříve firmu Modgen, a pak právě firmu Recombee. Tím si myslím, že jsem ty své doktorandy aspoň trochu dokázal u té vědy udržet. I když se časem ukázalo, že dělat byznys a studovat na doktorském studiu jsou dvě velmi rozdílné věci. Představoval jsem si to jednodušší.

Kristýna: Na FITu působíte jako proděkan pro spolupráci s průmyslem. Poslední dobou se na škole často konají různé hackathony. Snažíte se touto cestou studenty motivovat k zakládání vlastních startupů?

Já v těch startupech vidím obrovskou příležitost. Zvlášť když i sem tam jezdím po světě a vidím, jak to funguje v jiných ekosystémech. Jaká je tam podpora podnikavosti už třeba na střední škole a že i s jedním malým počítačem se dá prorazit do světa a vybudovat obří firmu. Tak si myslím, že je dobré to i tady u nás trochu víc podporovat.

[1] Pavel Kordík na FITu působí jako proděkan pro spolupráci s průmyslem.

Anička: Myslíte si, že by jich u nás na fakultě mohlo vznikat víc?

Osobně mám rád startupy, které jsou postavené na nějaké substanci, ideálně vědeckém výzkumu. Mají nějakou konkurenční výhodu. Ale zároveň jim pak může hrozit odtržení od byznysu, kdy se zhlédnou v nějaké super metodě, ale dělají výzkum a produkt, který nikdy nikdo nepoužije. Čím jsem starší a znám lépe, jak to funguje v byznysu a jak na škole, tak vím, jak moc je důležité se už od začátku ptát, kdo bude zákazník a jak mu vyřešit nějaký problém. Ale zároveň způsobem, který má nějakou přidanou hodnotu.

Myslím si, že naši studenti mají docela dobrou konkurenční výhodu v technologických znalostech. Oproti jiným školám, kde třeba vědí víc o byznysu a o tom, jak udělat powerpointovou prezentaci a sehnat peníze, si jsou sami schopni něco snadno a rychle zprototypovat. Takže si myslím, že by těch startupů na fakultě mohlo vznikat ještě víc. I když už teď jich není tak málo. Nedávno jsem se zúčastnil velké konference v Kanadě, kde byl zrovna fiťácký startup Fitify vidět poměrně hodně. Takže jen víc takových. A samozřejmě se to snažíme také podporovat z fakulty, ať už právě pořádáním hackathonů nebo potom i nějakou systematičtější podporou. Teď se dokonce jedná o tom, že by na ČVUT vznikl nějaký mechanismus, jak zakládání spin-offů lépe podporovat. Ale to asi ještě chvilku potrvá.

Anička: V jaké oblasti umělé inteligence vám přijde, že je teď aktuálně největší potenciál pro výzkum?

Kristýna: V čem vidíte tu budoucnost?

Jako abych zase předpověděl, co bude za 10 let zajímavé? (smích)

Kristýna: Přesně, ať víme, jaký startup založit.

Anička: To je tak akorát pro nás, než to naprogramujeme. (smích)

Já se obecně dlouhá léta zabývám neuronovými sítěmi a optimalizací jejich architektury. Teď se tomu moderně říká neural architecture searchmeta learning. Tam si myslím, že je třeba v oblasti posilovaného učení ještě dost potenciálu. Hrozně zajímavé projekty na fakultě teď děláme i se společností GoodAI, kde se věnujeme tomu, když naučíte umělou inteligenci řešit jeden problém, jak to převést na druhý problém (transfer learning).  Pak obecně optimalizační algoritmy pro učení, ať už supervizované, nesupervizované, tam taky ještě vidím velký prostor pro nějaký další kvalitní výzkum.

A samozřejmě aplikace do různých směrů. Např. zdravotnictví, vzdělávání… To jsou těžce zanedbané oblasti, kde se data, umělá inteligence a strojové učení skoro nevyužívají. Tam to teď pofrčí. To bude fofr. Tam vidím ten potenciál pro startupy, co jsou schopné udělat díru do světa. Třeba teď mám v hlavě takový globální produkt pro studenty, který by jim personalizovaně doporučoval experty-mentory, kurzy, projekty ve firmách –⁠ říkám mu meta-univerzita.

Kristýna: Pronikat s technickými inovacemi i do netechnických oblastí… S tím souvisí další otázka. Spustili jste iniciativu Elements of AI, v rámci které se snažíte o umělé inteligenci edukovat širokou veřejnost. Je to vůbec potřeba, aby lidé znali, jak modely vevnitř fungují?

Anička: Nestačí, když budou vědět, že to je blackbox, který se dá na něco použít?

To už je dobré, když toto lidé ví. Ale spousta lidí má magickou představu, že jim umělá inteligence vyřeší všechny problémy nebo ani neví, že se zrovna dostali do situace, kdy by ji mohli použít. To není dobré. Osobně umělou inteligenci beru podobně jako počítačové dovednosti. Dřív člověk musel umět na počítači, aby získal práci. Podobně to je s umělou inteligencí. Čím dál víc ji člověk bude potřebovat používat jako nástroj ke své práci, aby byl efektivní.

Anička: Takže Elements of AI se snaží nějakým způsobem demystifikovat umělou inteligenci? Že i obyčejný smrtelník ji může použít?

Ano. Nějakou přístupnou formou a hlavně i u lidí, kteří mají jiné základy. Vystudovali třeba sociologii, medicínu… Protože ve všech těchto oblastech je hodně prostoru. Já si myslím, že tito lidé mají výhodu i proti lidem, kteří studují jenom umělou inteligenci. Když máte ještě něco k tomu, tak vám to třeba pomůže vyřešit nějaký zajímavý úkol, přijít s novou metodou, kouknout se na problém trochu jinak…

Teď to vidím na tom, když s fakultním DataLabem a UNICO.ai pomáháme se zakládáním jednoho spin-offu AIfinity. A tam se přesně ukazuje, že ti naši ajťáci vůbec nerozumí proteinům, molekulám, zkrátka jak to v přírodě funguje. Tam mají výhodu právě lidé studující biomedicínské inženýrství, kteří si pak u nás dostudují jen umělou inteligenci, případně programování.

Anička:  Jak si myslíte, že si český výzkum v oblasti umělé inteligence mezinárodně stojí? Předpokládám, že celkem dobře?

No myslím, že nic moc. Mohlo by to být lepší. 

Kristýna: Takovou odpověď jsme nečekaly. (smích)

Je pravda, že oproti sousedním zemím jsme na tom relativně dobře. Když to ale porovnám s nějakými světovými superhuby, tak je to složité. Ukazuje se, že nám chybí kapacity v základním výzkumu a spolupráce s velkými firmami, které mají velké datasety, na kterých se dají dělat zajímavé výzkumy… Když se podíváte na počet publikací na nějakých velkých A* konferencích jako NeurIPS a ICML, tak tam úplně nevedeme.

To byl jeden z důvodů, proč jsem se pustil do iniciativy prg.ai, v rámci které se snažíme, aby společnost věděla, že budoucí prosperita leží v investicích do umělé inteligence. Ať už jsou to kapitálové investice, lidské investice nebo vzdělávání. Spousta lidí už to po světě pochopilo, dnes má AI hub skoro každý, tak doufám, že se to brzy dostane i k nám. 

Už dva roky se snažíme s prg.ai jít tímto směrem a ve městě máme velkou podporu. Je super, že se nám povedlo spojit vysoké školy a instituce, které spolu normálně tolik nespolupracují. ČVUT, Univerzitu Karlovu, Akademii věd… Tady mám pocit, že táhnou za jeden provaz. Je tam dobrá atmosféra, všichni se snaží posunout náš region dál. Máme k tomu doufám dobrý přístup, ne jen úzký pohled: „Teď nasypeme spoustu peněz do základního výzkumu a to vše vyřeší.“ Chceme mít dotaženou i vazbu do produktu a korporátů, abychom nápady a inovace, co vzniknou, dokázali přetavit v nějaký reálný byznys, produkt. V tom vidím naši výhodu, protože u nás v regionu máme poměrně hodně globálně úspěšných startupů.

[2] Zakládající členové prg.ai.

Anička: Jaké zajímavé startupy používající umělou inteligenci vlastně u nás vznikly?

Ze starších například Avast, dnes velká firma s velkým renomé, pro který je v kyberbezpečnosti umělá inteligence poměrně významná složka. Z těch mladších třeba Datamole, kteří vznikli u nás na FITu, mají už asi 50 datascientistů a dělají úžasné věci. Nebo Rossum.ai z FELu, kteří mají skvělý škálovatelný produkt. Takovéhle firmy tomu ekosystému dělají reklamu ve světě, jsou schopné přitáhnout peníze a už také reinvestují zpět do univerzity. Třeba Datamole má na fakultě dlouhá léta smluvní výzkum a zapojuje lidi do svých projektů. V Recombee zase doktorské studenty podporujeme pomocí Industrial Ph.D.

Začíná se to hezky vracet. Na produktu se vydělají peníze, ty se pak vrátí zpět do ekosystému, aby se podpořil výzkum a zlepšila se kvalita absolventů. To nám všichni závidí. Máme tu prostě dobré lidi.

Kristýna: A kdyby se nějaký student, například ještě bakalář, chtěl do nějakého výzkumu zapojit, může třeba k vám do laboratoře DataLab přijít, napsat?

Anička: Případně jakou to má přidanou hodnotu pracovat na nějakém projektu v laboratoři oproti práci při škole?

Tak to samozřejmě záleží, co kdo chce v životě dělat. Jestli být spokojený v korporátu, nebo má ambice dělat si svůj byznys, nebo jít do výzkumu. V DataLabu děláme základní výzkum, ale hlavně aplikovaný výzkum pro firmy… Stává se nám dokonce, že za námi přijde na Den otevřených dveří talent ze střední školy a my ho zaměstnáme už jako středoškoláka na nějakém projektu, protože je vidět, že chce pracovat a něco se naučit. Jsou to sice jednotky, ale stává se to.

Kristýna: Takže když vidíte zájem tak není problém?

No jasně. A teda úplně nejraději máme, když ten člověk už něco umí a je samostatný. Potom jsme schopní ho zapojovat i do různých větších projektů. V DataLabu nám teď běží spoustu zajímavých projektů například s Meteopressem, pro který děláme neuronovou predikci počasí ze satelitních snímků, začínáme projekt s Y Soft, kteří vyvíjí tiskárny a IoT, což řešíme i s Datamolem. Spolupracujeme také s firmou Carvago, která má unikátní dataset, STK starých aut napříč Evropou, z kterého je možné predikovat zůstatkovou hodnotu auta, což je další zajímavá aplikace. Rozjíždíme spolupráci s uLékaře.cz, která se zabývá telemedicínou, nebo se nám teď rozbíhá několik projektů se Škodovkou od samořiditelných formulí přes věci kolem jejich datové infrastruktury a věcí kolem UI. A takhle bych mohl ještě pokračovat dlouho… (smích)

[3] Pavel Kordík se studenty v laboratoři.

Anička: Teď na vás máme možná trochu filozofickou otázku, jaký máte názor na výzkum obecné umělé inteligence? Myslíte si, že to je něco, co někdy dokážeme vytvořit?

Kristýna: Na CIIRCu to teď zkoumají…

Zkoumají to nejen na CIIRCu, například v Datalabu máme Industrial Ph.D. doktoranda Petra Šimánka sponzorovaného GoodAI, který se výzkumem obecné umělé inteligence také zabývá. 

Já jsem vždycky takový optimista. Tedy tady je otázka, jestli je to optimismus, nebo pesimismus, ale myslím si, že AGI (artificial general intelligence, pozn. red.) tu nakonec bude. Bude to trvat ještě nějakou dobu, ale postupně se blížíme. Ona je ta definice AGI taková těžká. Nevíme úplně přesně, kde obecná umělá inteligence vůbec začíná, jestli už by se za to dal považovat transfer learning, nebo jestli ještě potřebujeme nějaké víc high level uvažování…

Věci, které teď vznikají, moc daleko k obecné umělé inteligenci nemají. Opět záleží, co s AGI budeme chtít dělat. Myslím si, že nahrazovat lidskou práci pomocí AI jde docela rychle ve všech možných oborech a je otázka, kam tenhle výzkum povede. Určitě nejsem pro nějakou extra intenzivní regulaci, ale samozřejmě je určitě na místě regulovat takové věci, jaké se teď dějí v Číně. Z toho bych neměl radost, kdybychom se něčeho podobného dočkali i u nás.

Kristýna: Ona je taky otázka, někdo říká, že umělá inteligence dnes není žádná inteligence, že to jsou jen nějaké specializované modely. Ale na druhou stranu, my jako lidi máme hrozně moc podnětů, ze kterých se můžeme učit. A pak ty modely, co dneska máme, můžou už třeba trošku simulovat náš mozek, ale nikdy při učení nedostanou tolik podnětů jako my, když vyrůstáme a poznáváme svět kolem, dalo by se říct pomocí posilovaného učení…

Je to přesně o tom. Člověk od umělé inteligence nemůže mít očekávání jako od normálního člověka, protože ten má nějaké své „datasety“ a interakce, které ta umělá inteligence nemá, a má na své „natrénování“ spoustu času. I když tyhle věci už se taky v moderních metodách umělé inteligence objevují. Vznikají různé multiagentní systémy s agenty modelovanými pomocí neuronových sítí, které jsou založené na tom, že nějací agenti učí jiné agenty.

Nebo metody typu Self-Play, kdy necháváme agenty hrát proti sobě a tím se vylepšují. To jsem kdysi dávno zkoušel na té střední škole. (smích) A někdy je to až strašidelné, když člověk vidí, jak je to schopné objevit strategie, které by člověka ani nenapadly. Za mě už je ta umělá inteligence v některých směrech chytřejší než člověk, co se týče klasické definice inteligence, kterou máme. Ale teď se podívejte, jak my umíme měřit inteligenci, nějakými umělými testy, kdy nevíme, jestli měříme sociální inteligenci, geometrické porozumění… Ale mám pocit, že na nějakých těch definovaných úlohách už ta umělá inteligence umí například žákům středních škol poměrně konkurovat.

Já se teď třeba trochu snažím posunout oblast predikce následujícího košíku. Protože si říkám, že člověk nemůže dělat úplně všechno a musíme si vybrat ty oblasti, kde máme nějakou nefér výhodu. Obecnou umělou inteligenci dělají úplně všichni a když na to Google nasadí tisíc lidí a superpočítače, tak tomu se těžko konkuruje. A ta naše nefér výhoda v predikci následujícího košíku je v tom, že máme v Recombee unikátní dataset chování zákazníků s několikaletou historií a stovkami milionů nákupů. A na tom už si ta umělá inteligence umí vytvořit nějaké vzory historického chování a extrahovat z toho ne úplně primitivní pravidla, která člověku unikají. Teď na to zkoušíme nasadit modely založené na rekurentních neuronových sítích a transformerech, které se obyčejně používají na rozpoznání textu a strojové překlady. Kolegové se mi sice pořád smějí, že to nemůže fungovat, že to v těch datech není, ale já pořád říkám, že jsme do toho ještě nedali dost výpočetních prostředků a nevyzkoušeli další architektury. Protože když do toho člověk dá dost, tak je šance, že se mu to podaří lousknout, a to jsou pak právě ty globálně úspěšné startupy, které jsou schopné přijít na trh s novými produkty. Když umím dobře predikovat košík, tak můžu například dělat prediktivní zavážku, kdy lidem doručím zboží bez toho, aby si ho objednali. Takže takové věci se myslím dělat dají, jen je potřeba je objevit nejen z toho technického pohledu, ale i z toho byznys pohledu.

Kristýna: To zní skvěle, umělá inteligence co za nás sama nakoupí… Jako poslední otázku se vás chceme zeptat, jaké si ještě kladete cíle, ať už v rámci výzkumu umělé inteligence na FITu, nebo třeba v rámci prg.ai? Co byste byl rád, aby se ještě podařilo?

No, já mám cíl dopsat jeden článek, který už měl být měsíc hotový a nějak se mi to nedaří. (smích) Ten článek se zabývá vysvětlitelností doporučovacích systémů. S irozhlas.cz se teď zabýváme, jak můžou doporučovací systémy pomoci v novinařině. A to je něco, co mě teď z hlediska těch krátkodobých cílů hodně baví. Kombinace doporučovacích systémů a novinařiny je podle mě super téma, které není jen o výzkumu, ale i o nějakém sociálním inženýrství. Kde se vůbec nachází vztah člověk-stroj? Protože v té redakci jsou nějací editoři, kteří nemohou mít pocit, že jim ten stroj úplně vzal práci. Je tam potřeba objevit nějaký interface, kterým oni s tou umělou inteligencí komunikují a mají pocit, že jim šetří práci.

A z toho dlouhodobějšího a strukturálního pohledu je to přitáhnout k nám na FIT víc vědců ze zahraničí. Už se to teď částečně daří, kdy k nám začínají jezdit na stáže přes léto, ale bylo by skvělé, kdyby se nám to podařilo rozjet ještě trochu ve větším měřítku. A pak samozřejmě sehnat víc peněz i do toho základního výzkumu, protože tam jsme v Česku oproti zahraničí hodně podfinancovaní. Jak mám blízko k byznysu, tak se snažím vymyslet způsoby, jak i ten základní výzkum financovat víc z firem, například právě díky prg.ai ekosystému. A co se týče výzkumných témat, nemůžeme být na FITu odborníci na všechno, musíme si vybrat pár věcí, které nám jdou, a na ty lákat další lidi a shánět peníze a projekty. A to prg.ai to pak všechno hezky zastřešuje, protože jestli chceme přitáhnout evropské centrum umělé inteligence k nám do Prahy, tak to se nepodaří díky jedné laboratoři na FITu, to musíme všichni táhnout za jeden provaz. To je další takový osobní cíl, kdyby se to třeba i díky prg.ai povedlo.

Anička: To je krásné zakončení.

Kristýna: Budeme doufat, že se to povede. Děkujeme za rozhovor.


Autorky:
Anna Sajdoková, Kristýna Klesnilová
Foto:
Úvodní – prg.ai
Medailonek – Archiv Pavla Kordíka
[1, 3] Archiv FIT ČVUT v Praze
[2] zpravy.aktualne.cz

Kristýna Klesnilová

Na FITu studuju bakaláře na oboru Znalostní inženýrství, a abych školu poznala i z jiné stránky než jen z té studijní, rozhodla jsem se přidat do redakce časopisu. Když o sobě zrovna nemůžu říct: „Nemám čas, dělám progtest”, tak si s oblibou kromě cppreference.com přečtu i nějakou jinou zajímavou knížku nebo se zvednu od počítače a vyrazím si ven zasportovat. Kontaktovat mě můžete na klesnkri@fit.cvut.cz.