Infosajand nõuab palju uusi oskusi ning nende pidevat arendamist. Lisaks koolist saadavale oskustele lugeda, kirjutada ja kuulata, on vaja näiteks oskusi, kuidas tarbida meediat, kuidas käituda sotsiaalmeedias. Üha enam on vaja ka oskust lugeda andmeid. Ettevõtluses võib tihtilugu kohata märksõnu nagu suurandmed (big data), masinõpe (machine learning), iseteenindav ärianalüütika (self-service business intelligence) jne. Nende teemade mõistmine nõuab uut laadi võimet – võimet andmetest aru saada. Ingliskeelse sõnana tähistatakse seda sõnaga „data literacy“ ehk oskus kõnelda ja kirjutada andmete keeles.
Esmapilgul näib see ehk iseenesest mõistetavana. Numbrid on ju kõigile tuttavad ja oksus esitleda numbreid graafikutena ning graafikuid lugeda võiks olla samuti paljudel käpas. „Data literacy“ ehk andmekeelse kirjaoskuse sisu peitub aga selles, et numbritest tuleks aru saada just nii nagu kirjanik ehk analüütik või statistik seda soovinud on. Andmete lugemisel peaks moodustuma infolugu ehk data story. Paradoksaalselt on maailmas järjest rohkem informatsiooni, kuid samas üha vähem arusaamist asjade tegelikust sisust. Kuidas parandada andmete kirjakeele oskust oma ettevõttes, et teha selle abil ettevõttele kasulikumaid otsuseid? Käesolevas artiklist leiab mõningad soovitusi andmekeele paremaks lugemiseks.
Pildid kui andmekeele sõnad
Kui tavapäraselt koosneb kirjakeel lausetest ja sõnadest, siis andmekeele moodustavad pildid. Miks just pildid? Hiina vanasõna ütleb, et üks pilt räägib rohkem kui tuhat sõna. On teada, et inimene hangib ümbritsevast infost 70% silmade ehk nägemismeele kaudu. Järelikult on visuaalne infotöötlus parim abivahend on andmete esitamiseks. Visuaalide loomisel on olemas omad reeglid ja standardid, mida teades muutub andmekeele lugemine hõlpsamaks. Kui selle kohta, kuidas luua häid visuaale, leiab palju õpetlikku kirjandust, siis märksa vähem on käsitletud seda, kuidas infotarbija võiks andmekeelt lugeda.
Näiteks, kui inimesele mõnda graafikut näidata, läheb tema tähelepanu tihtilugu otse graafiku keskele. Just sealt punktist püütakse hakata looma endale arusaamist graafikust – olgu see siis tulpdiagramm, joondiagramm, mullidiagramm või mõni muu visuaal. Keskpunkt pole aga graafiku lugemisel tingimata kõige mõistlikum alguspunkt.
Erinevad graafikud erinevaks otstarbeks:
Alusta pealkirjast
Nii nagu ajakirjanduses, kus pealkirjal on määrav roll, on ka graafikute ja visuaalide puhul väga tähtis just nende pealkiri. Seega tasub esmalt tutvuda graafiku pealkirjaga, mis peaks avama graafiku sisu. Pealkirja puudumisel tekib oht, et jääb visuaal segaseks ning igal vaataja teeb omad järeldused. Hea pealkiri avab graafiku eesmärgi. Näiteks on võimalik ühte graafikut pealkirjastada kolmel erineval viisil:
- Müük
- Müük jooksval aastal
- Poodide müük kuude lõikes (periood 01.01.2017 kuni 28.02.2017)
Kolmas pealkiri on neist kõige täpsem ja ühemõttelisem. Kui graafiku pealkirjaks on lihtsalt „Müük“ või „Müük jooksval aastal” jätab see tõlgendamiseks liiga palju ruumi. Viimasel ajal on tekkinud trend sõnastada graafiku pealkiri küsimusena stiilis „Milline on klientide lahkumise trend kuude lõikes?“ See on hea lähenemisviis, sest määratleb täpselt selle, mille kohta graafikul vastuse peaks andma.
Mida kõnelevad teljed?
Teisena soovitaks ma suunata tähelepanu graafiku telgedele. Enamasti on graafikud esitatud x ja y teljestikus. Jälgida tasuks, kas telgedel on nimed ning mis ühikutes on erinevad teljed esitatud. Samuti, kas teljed on kvalitatiivsed (kirjeldavad), kategoriseerivad või numbriliste väärtustega?
Kui arusaamine telgedest on tekkinud, siis tuleks mõtestada x ja y telgi koos. Mis lugu need teljed räägivad? Enamlevinum lugu on mingi arvulise väärtuse, näiteks müügikäibe muutumine aegreas ehk nn trendigraafik.
Üheks oluliseks teemaks on veel ka telgede skaalad. Siin on mitu huvitavat nüanssi. Näiteks, kas X/Y skaala algavad väärtusest 0 või mõnest suuremast väärtusest või on skaaladel ka negatiivsed väärtused ? Kas laoseis mõne kauba osas mõnes ajahetkes on lihtsalt 0 ehk kaup otsas, või on see suisa miinuses ehk tooteid on mõne kliendi poolt juba tellitud, kuid meil veel tarnimata. Ostujuhile väga oluline info järgmiste perioodide tellimusi planeerides. Kui x telg on ajaline, siis tasub üle vaadata, kas kuvatud on kõik ajaperioodid (st kas graafik on pidev) või ainult need ajaperioodid, kus esinevad arvväärtused. Graafikud, kus näidatakse nädala müüki koos puhkepäevadega ja ilma puhkepäevadeta, on erinevad.
Uuri legendi ja allikat!
Enne graafiku lugemist tuleks korraks uurida graafiku legendi ning lisainfot andmeallika kohta. Graafiku legend annab reeglina vihjeid selle kohta, mis vahe on punasel ja sinisel värvil ning mida erinevad kujundid – ristkülikud, punktid, ringid jms – tähendavad. Lisaks võib graafikul olla veel erinevaid jooni, näitena punktiirjoontena, millel võib-olla eraldi tähendus.
Üldiselt on hea tava, et graafiku all on kirjas info algallikas. Vahel on see info esitatud nupuna või küsimärgina graafiku ülanurgas. Allikas annab aimu esitatud info usaldusväärsuse, aga ka tõlgendamise või taustsüsteemi kohta. Ilmselt on erinev suhtumine andmetesse, mis pärit auditeeritud majandusaasta aruandest või mõnest arvamusuuringust.
Millise loo andmed ettevõttest räägivad?
Kui eeltöö tehtud ja eeldused loodud, saab graafiku sisusse süveneda. Eelnev tutvumine pealkirja, telgede, legendi ja andmete allikaga loob ajus seosed selleks, et tekiks lugu (nn „story telling“). Nii nagu sõnadest saab lause, moodustub hea andmekeele najal piltidest lugu. Lugu ehk narratiiv on meie ajule hästi seostatav ning jääb hästi meelde. Andmed võivad rääkida lugusid ettevõtte üha efektiivsemast tarneahelast, müügi mustritest või näidata kätte ootamatult tekkinud kitsaskohad. Kui näiteks müük on ootamatult langenud, võib andmelugu meile näidata kätte aja ja koha ning toote, mille tõttu see on langenud ning sealt edasi juba järgmisel graafikul näiteks tuua välja ka konkreetse müüja või tarnija, kellega peaks tööd tegema, et olukorda järgmisel korral ennetada.
Alati võib juhtuda, et andmekeeles tekitatud graafik on segane ning ei peida endas üldse infot – tekib küsimus, mida püütakse graafikuga ütelda. Kuidas hinnata, kui heas andmekeeles on graafik kirjutatud? Üheks hindamise aluseks on küsida enese käest peale graafikuga tutvumist, kas saadud lugu on piisav, et selle põhjal teema üle arutleda, midagi otsustada (mis võib olla esineda ka otsusena mitte midagi teha) või vajadusel edasi tegutseda? Kui mõni neist kolmest tingimused on täidetud, siis saab kindel olla, et nähtud viusaal on kirjutaud heas andmete kirjakeeles.
Vaata ka mis on 5 enamlevinud andmevisualiseerimise lõksu: