Prediktivní modelování
Modelování časových řad
Modelování časových řad je možné provádět pomocí klasických nástrojů modelování časových řad, jako jsou modely využívající autoregrese (ARMA, ARIMA), jejich rozšíření o sezonalitu (SARIMA) či doplnění o externí regresory ([S]ARIMAX). Vhodný typ modelu a jeho parametry se volí na základě pečlivé analýzy studované časové řady (určení jejích statistických vlastností apod.).
Další typy modelů jsou založeny na strojovém učení. V tomto případě lze buď využívat aplikační balíky, jako je například Prophet, který je založený na aditivním regresním modelu a bayesovském modelování, nebo navrhnout a implementovat vlastní neuronovou síť pro predikci konkrétní časové řady. Nejčastěji používáme rekurentní sítě typu LSTM/GRU, které jsou implementované v běžně dostupných frameworcích (TensorFlow, PyTorch). Je třeba mít na paměti, že pro úspěšné učení neuronové sítě jsou přitom nezbytná dostatečně rozsáhlá data.
Dalším příkladem námi řešeného datového modelování může být vysvětlení vlivu jednotlivých regresorů na chování časové řady.
Řešené projekty smluvního výzkumu
ADLER Czech, a.s.: Datová analýza ve společnosti ADLER Czech, a.s., 2019 – 2020.
Severočeské doly a.s.: Analýza využití metod strojového učení pro monitoring a predikci vývoje stavu spodní vody v dobývacím území, 2020 – 2021.
Datová analýza ve společnosti ADLER Czech, a.s. (nyní MALFINI a.s.)
Cílem projektu bylo navrhnout a otestovat model založený na rekurentních neuronových sítích pro predikci prodeje obchodovaných komodit. Dalším dílčím cílem bylo porovnání přesností odhadů prodeje komodit mezi modely na bázi autoregrese. Řešení spočívalo ve výběru a analýze vstupních dat včetně jejich očištění. Bylo nutné navrhnout funkční architekturu neuronové sítě vzhledem k dodaným datům. Postupně byla otestována celá řada konkurenčních modelů, které se lišily na úrovni délky vstupních dat, použitých regresorů, architektury a topologie sítě a jejich parametrů. Modely byly mezi sebou porovnány z hlediska úspěšnosti predikce prodejů na zadaná časová období. Pro každou z prodávaných komodit na daném trhu bylo určeno, který model je nejvhodnější a zda je konkurenceschopný se současně používaným modelem.
Analýza využití metod strojového učení pro monitoring a predikci vývoje stavu spodní vody v dobývacím území
Cílem tohoto projektu je navrhnout lineární regresní model pro modelování hloubky hladiny na vrtech. Vychází se z dodaných meteorologických a geofyzikálních dat. Nedílnou součástí projektu je konsolidace dat a ověření jejich vhodnosti pro modelování. Návrh modelu spočívá ve výběru a konstrukci dalších vhodných veličin (např. agregované srážky za období, průměrná teplota v časovém rámci, délka časového rámce) pro každý z vrtů. Tyto veličiny jsou použity pro regresní model. Očekávané výstupy nejsou predikce chování v budoucnosti, nýbrž kvantitativní posouzení vlivu jednotlivých regresorů na chování hloubky hladiny.