Studenti FIT obohatili H2O.AI o algoritmy strojového učení

V srpnu 2019 se americký startup H2O.AI stal bronzovým partnerem Fakulty informačních technologií ČVUT v Praze. H2O.AI je softwarová firma vytvářející platformy a produkty, které pomáhají uživatelům využívat strojové učení a umělou inteligenci v praxi, od jejího návrhu až po produkční nasazení. Cílem spolupráce mezi H2O.AI a univerzitou je nabídnout studentům zadání projektů především z oblasti strojového učení a umělé inteligence. A to takovou formou, aby si studenti krom cenných vědomostí odnesli i zkušenost pracovat na zadání, jehož výsledek má reálnou šanci na využití tisíci uživateli z celého světa.

H2O.AI se snaží studentům vyjít vstříc, a přináší tři formy spolupráce tak, aby byly vyváženy zájmy a časové možnosti studenta, a nakonec byly výsledky využity jak pro H2O.AI, tak pro studium na univerzitě. První možností je vybrat si zadání, která přispívají do closed source produktů H2O.AI. Výsledky práce pak budou využívat světoví hráči nejen na poli informačních technologií.

Druhou, pro někoho možná zajímavější, možností je pracovat na připravených zadáních týkajících se H2O-3 Open-source Machine Learning platformy a svou implementací zasáhnout kolem 18 000 korporátních i běžných uživatelů. Hlavní výhodou přispívání do H2O-3 Open-source Machine Learning platformy je, že veškerý kód, který student vypracuje v rámci zadání, je dostupný ve veřejně přístupném repozitáři na GitHubu. Kromě toho, že si studenti vyzkouší přispět svým kódem do velkého projektu, jejich práce bude vidět a mohou ji dále využívat jako referenci.

Třetí možností je přijít s vlastním zadáním. Pokud studenta zajímá nějaký konkrétní algoritmus strojového učení, který v H2O-3 není implementován, nebo existuje vylepšení stávajícího algoritmu, lze zadání přizpůsobit na míru. Možností je i vytvořit zadání pro závěrečnou práci, ať už bakalářskou či magisterskou. Zde mohou studenti uplatnit svoje zájmy v plném rozsahu a zároveň si být jistí, že jejich práci někdo využije.

V loňském akademickém roce H2O.AI úspešně zakončila dvě spolupráce se studenty FIT ČVUT. I přes to, že bylo pro oba studenty těžké se ze začátku zorientovat v kódu, svá zadání zvládli a vznikly tak dva nové významné algoritmy v rámci H2O-3 platformy. A to TF-IDF algoritmus pro zpracování textových dat, který zpracoval Bc. Ján Jendrušák. Dále pak algoritmus Extended Isolation Forest vylepšující hledání anomálií v datech, který implementoval Ing. Adam Valenta. Více o jednotlivých algoritmech a zkušenostech studentů s implementací si můžete přečíst na blogu H2O.AI

A co spolupráci říkají samotní studenti?

“Kromě cenných zkušeností s implementací nového algoritmu do velké a známé open-source knihovny jsem díky spolupráci s H2O.AI vytvořil smysluplnou diplomovou práci a úspěšně tak zakončil své magisterské studium na FIT ČVUT. V neposlední řadě jsem následně v H2O.AI začal pracovat na pozici Softwarový inženýr.” říká Ing. Adam Valenta.

“Rozhodně tento způsob spolupráce mohu doporučit. Věřím, že tento typ spolupráce skvěle nastartuje vaši další kariéru. Pokud si nejste jistí, na jakou oblast informatiky se zaměřit, lze takto využít příležitosti pracovat na zadání z reálného světa a ujistit se, jestli je tento směr správný, nebo ne. Kromě toho je to jedna z možností jak si při studiu přivydělat pěkné peníze,” komentuje Bc. Ján Jendrušák.

V případě zájmu o spolupráci mohou studenti nalézt konkrétní zadání na Portálu spolupráce s průmyslem, nebo firmu kontaktovat přímo e-mailem na academic-prague@h2o.ai.

Highlight

V loňském akademickém roce H2O.AI úspešně zakončila dvě spolupráce se studenty FIT ČVUT. I přes to, že bylo pro oba studenty ze začátku těžké se v kódu zorientovat, svá zadání zvládli a vznikly tak dva nové významné algoritmy v rámci H2O-3 platformy.

Ukázka, jak může Extended Isolation Forest algoritmus zlepšit detekci anomálií

Zdroje:

Stránky firmy: https://www.h2o.ai/

Github repozitář: https://github.com/h2oai

Odkaz na blog H2O.AI: https://www.h2o.ai/blog/h2o-3-improvements-from-two-university-projects/

Ukázka implementace TF-IDF: https://github.com/h2oai/h2o-3/pull/4380

Ukázka implementace Extended Isolation Forest: https://github.com/h2oai/h2o-3/pull/4319

Odkaz na diplomovou práci Ing. Adama Valenty: https://dspace.cvut.cz/bitstream/handle/10467/87988/F8-DP-2020-Valenta-Adam-thesis.pdf

Autor: Veronika Maurerová z H2O.AI