En problemstilling mange bedrifter møter når de skal starte innsiktsarbeidet er hvorvidt de skal etablere en dataplattform eller om en ren Business Intelligence-løsning som Power BI er tilstrekkelig.
Det kan være en vanskelig avgjørelse hvor ulike typer aktører har en tendens til å ha veldig sterke meninger om beste praksis. Leverandører av dataplattformer er ikke overraskende ofte kritiske til å gjøre all datahåndtering i BI-løsningen, mens BI-entusiaster ikke alltid skjønner poenget med en egen (og gjerne dyr) dataplattform.
Men først, hva er en dataplattform?
En dataplattform er en løsning hvor man blant annet samler, lagrer og administrerer data fra ulike typer kilder. Disse dataene gjøres så tilgjengelig for andre løsninger og behov i organisasjonen.
Dataplattformer finnes i ulike innpakninger fra ulike leverandører, men er typisk satt sammen av ulike tekniske komponenter fra aktører som Microsoft, Amazon og Google.
Argumenter for å etablere en dataplattform er at man får enda bedre kontroll og sentral styring på datakvaliteten og at «samme sannhet» dermed vil bli brukt rundt i organisasjonen.
Argumenter mot går på at det ofte blir et dyrt, komplisert og til og med unødvendig mellomledd avhengig av brukernes behov.
Et veldig forenklet (og nesten tåpelig illustrasjon) av «fra-data-til-BI-prosessen» med en dataplattform:


Mens man da uten en data plattform kobler seg direkte til kildene fra Power BI:

Avgjørelsen om en trenger en dataplattform eller ei må selvfølgelig tas på bakgrunn av et selskaps behov. Et lite selskap som "bare" ønsker å forbedre og automatisere sin egen månedlige regnskapsrapportering trenger ikke en dataplattform. Et selskap som omsetter for milliarder hvor dataanalyse er kjernen i forretningsmodellen trenger en dataplattform.
Ytterpunktene er jo ofte enkle, men så er det som vanlig sånn at de fleste havner en plass midt mellom og det er lett å bli usikker hva som blir best for nettopp din bedrifts behov.

De vanligste punktene å vurdere er de fem V'ene innen Big Data (eller seks/syv som noen opererer med).
I tillegg vil jeg også anbefale å starte med og stille deg selv følgende fem spørsmål:
1 - Hva er formålet med arbeidet?
Er dere tidlig i innsiktsfasen og er mest av alt nysgjerrige på potensialet deres forretningsmodell og bedrift har ved å utnytte dataene bedre? Da er min anbefaling å prøve dere først på en pilot direkte i Power BI. Da vil man fort og effektivt se resultater og skaffe seg et godt erfaringsgrunnlag for videre vurderinger. Har man allerede en vellykket BI-basert rapportering i selskapet og ønsker å ta videre steg for å virkelig bli en datadrevet organisasjon? Da er kanskje en investering i en dataplattform et lurt valg.
2 - Hvilken kompetanse har dere?
Mange bedrifter har allerede relevant kompetanse som kan brukes på å etablere en dataplattform, selv om man ikke har benyttet det til intern analyse enda. Kanskje håndterer man allerede data i forbindelse med noen digitale produkter man selger eller lignende. Og det sier seg jo selv; har man relevant kompetanse tilgjengelig er selvfølgelig terskelen for å ta i bruk en dataplattform lavere.
3 - Hvor mange BI-brukere er det i organisasjonen?
Er planen å demokratisere analysejobben slik at det vil sitte ulike BI-brukere rundt om i organisasjonen? Eller er det noen få BI-ansvarlige som skal ha full kontroll på all databehandling og analyse i selskapet? Begge deler kan være fornuftige strategier, men jo mer demokratisert dataene skal være, jo mer taler det for en dataplattform.
4 - Hvor mange systemer skal benytte dataene?
Dersom behovene til organisasjonen dekkes «kun» ved å benytte eksempelvis Power BI, så bør funksjonaliteten Dataflows i Power BI være tilstrekkelig. Forventer man derimot at dataene også skal brukes i integrasjoner med andre applikasjoner eller til AI/ML, så taler det absolutt for en dataplattform.
5 - Hvordan hentes data fra kildene?
Har man allerede tilgang til kildedataene via gode databaser forenkler det jobben med å koble Power BI direkte dit. Power BI håndterer jo også APIer godt direkte, men det kan i noen tilfeller være situasjoner som gjør at det kan være like lurt å håndtere dette i en dataplattform først, for deretter å koble til Power BI. Et eksempel på det er om man skal hente to millioner transaksjoner, hvor det spesifikke APIet kun tillater 10.000 svar for for hvert kall.

Jeg har ikke selv kompetanse til å etablere og drifte en dataplattform - og sånn sett er jeg kanskje "biased" mot å anbefale og bruke Power BI direkte.
Samtidig, jobben med å koble Power BI mot en godt driftet dataplattform er gjerne enklere enn å knote med uttalige APIer for å få kommet i gang med analysene - så derfor ser jeg på meg selv som upartisk i slike avgjørelser.
Jeg jobber for at kundene mine skal få verdi fra dataene sine - og verdi for en organisasjon skjer først når man bruker dataene til å finne innsikt. Enten man går via en dataplattform eller ei.
Ellers kan jeg også anbefale Stavangerbaserte BI Builders sitt innlegg om hvorfor det kan være et behov for en dedikert dataplattform selv om Power BI har ETL-funksjonalitet. Selv om BI Builders selger en dataplattform (Xpert BI) så opplever jeg dette blogginnlegget som relativt objektivt.
Hadde det vært nyttig med mine innspill i diskusjonen dere har rundt dette i din bedrift akkurat nå for tiden? Ta i så fall kontakt på eivind@austbo.as.