Prediktiivisellä analytiikalla hyödyt esiin aikasarjoista

21.4.2020

Prediktiivinen analytiikka viittaa datan pohjalta tehtävään matemaattiseen tulevaisuuden ennakointiin. Matemaattisilla malleilla voidaan löytää historiadatassa piileviä säännönmukaisuuksia, jotka suurella varmuudella toistuvat myös tulevaisuudessa.

Usein prediktiivisellä analytiikalla tutkitaan aikasarjoja eli dataa, joka on aikajärjestyksessä. Kun tarkastellaan esimerkiksi tietyn tuotteen myyntilukuja eri kuukausilta, on kyseessä aikasarja. Samoin tuntikohtaiset sähkönkulutukset tai sekuntikohtaiset tiedonsiirtonopeudet ovat aikasarjoja.

Aikasarjoissa esiintyy usein trendejä sekä kausivaihteluita. Joskus ne erottaa helposti paljaalla silmällä, mutta usein ne jäävät satunnaisen kohinan sisään piiloon. Matemaattisella tarkastelulla ne voidaan kuitenkin saada tarkkaan selville ja niiden perusteella voidaan tehdä laadukkaita arvioita tulevasta. Kehittyneillä algoritmeilla tämä voidaan automatisoida ja tulokset syntyvät muutamassa sekunnissa.

Algoritmien avulla saadaan yleensä tarkempi ennuste kuin asiantuntija-arviolla ja merkittävästi nopeammin. Jos ennustettavana on seuraavan kahden vuoden kuukausittaiset luvut tuhannelle eri kuluriville, on suuri kiusaus vain kopioida edellisvuoden luvut suoraan ennusteeksi. Kaikkien rivien käsittely ajatuksen kanssa veisi hyvin kauan. Jos kuitenkin luodaan prediktiivisillä algoritmeilla ennuste automaattisesti ja silmäillään tulosten visualisointi läpi, työmäärä kutistuu murto-osaan ja huolimattomuusvirheen mahdollisuus minimoituu.

Erityistapauksissa hyödytään toki silti yhä asiantuntijan antamista lisätiedoista. Esimerkiksi voidaan tietää, että tietyn tuotteen kahdesta tuotantolinjasta toinen poikkeuksellisesti suljetaan vuoden päästä. Tällöin suunnittelijan tulee täydentää kyseinen tieto ennusteeseen, koska sitä ei algoritmi voi historian pohjalta tunnistaa. Algoritmi on työkalu, jolla asiantuntija kykenee tuottamaan parempia ennusteita ja nopeammin kuin aiemmin. Tällöin työaikaa vapautuu ennusteiden tekemisestä tulosten kehittyneempään hyödyntämiseen.

Prediktiivinen analytiikka voi hyödyntää myös tunnettuja riippuvuussuhteita eri muuttujien välillä. Klassisena esimerkkinä voidaan huomioida muita aikasarjoja, joiden osalta asiantuntijat osaavat antaa tarkkoja arvioita tulevaisuuden tilanteesta. Esimerkiksi tuotantolaitoksen energiankulutusta ennakoidessa voidaan antaa algoritmille suunniteltujen tuotantomäärien aikasarja. Tällöin algoritmi sekä perehtyy historiadataan että huomioi suunnitellut muutokset tuotantomäärissä.

Joissain tapauksissa prediktiivistä analytiikkaa voidaan hyödyntää myös sellaiseen aikasarjaan, josta ei itsestään ole historiadataa. Tämä voi onnistua silloin, kun on saatavilla läheisessä riippuvuussuhteessa olevan aikasarjan historialukuja. Esimerkiksi voidaan tietää polttoaineen historialliset hankintamäärät, mutta halutaan ennakoida kulutusta. Jos kerralla hankitaan suuria määriä, mutta kulutuksen tiedetään olevan hankintaa tasaisempaa, voidaan hankintadatasta käyttää liukuvaa keskiarvoa kulutusennusteen lähtökohtana. Tällöin kausivaihtelut ja trendit huomioidaan, mutta ennuste ei ole yhtä herkkä esimerkiksi sille, onko kuun vaihteessa tapahtunut hankinta kirjattu päättyvälle vai alkavalle kuulle.

Mikäli aikasarjassa on kausivaihtelua, historiadataa analyysille tulisi olla vähintään kahden kauden pituudelta. Esimerkiksi lämpötilamittauksista olisi syytä olla kahden vuoden historiadata vaikkapa kuukausitasolla, jotta voitaisiin analysoida tulevien kuukausien lämpötilaa. Jos historiadataa on enemmän, sen parempi.

Prediktiivinen analytiikka parantaa ennusteiden laatua ja vapauttaa asiantuntijoiden työaikaa manuaalisesta työstä tulosten parempaan hyödyntämiseen. Sen toteutus ja käyttöönotto on myös verrattain hyvin suoraviivaista, minkä vuoksi se on hyvä ensimmäinen askel algoritmeja hyödyntävään analytiikkaan.

Ohessa on video demo englanniksi aiheesta, mikäli haluat nähdä miten algoritmi käytännössä toimii.

Visa Linkiö
Data Scientist