Receptet för en modern och skalbar plattform för datalagring och analys
Nya behov av data innebär också nya krav på teknik och verktyg, inte minst om du vill använda AI. Med en Data Lakehouse-lösning kan både strukturerad och ostrukturerad information samlas på en plats och ligga till grund för en mängd ändamål.

Datamängderna bara växer och växer, både i enskilda verksamheter och i samhället i stort. Informationen kommer i olika format och är långt ifrån alltid tabulärt strukturerad, utan är ofta också helt ostrukturerad. Realtidsdata från sensorer på maskiner och annan utrustning är också ett område som expanderar.
Hur kan alla dessa typer av data användas för att fatta bättre och mer agila beslut?
Den frågan ställer Jasse Tykkyläinen och Johan Ripgården, lösningsarkitekt respektive erbjudandeansvarig inom Analytics på Atea, när de under årets Bootcamp håller det gemensamma passet ”AI-resan startade när ni lämnade Excel hell…”.
Johan Ripgården inleder med en rad önskescenarier från olika branscher: Djupanalyser av kundenkäter för att hitta mönster och trender över tid. Analyser av historiska kundtransaktioner på en bank kombinerade med scannade kvitton eller händelsebeskrivningar för att upptäcka bedrägerier. Försäljningsanalyser som kombinerar produkt- och försäljningsdata med kundrecensioner som lyfter fram funktioner och egenskaper som ökar eller minskar försäljningen.
Han nämner även prediktivt underhåll inom industrin, det vill säga möjligheten att i realtid upptäcka maskiner som är på väg att gå sönder innan de hinner göra det, och potentialen inom vården att utifrån blandade källor hitta mönster hos patienten som normalt är svåra att se.
Viktigt att demokratisera data

Jasse Tykkyläinen, senior lösningsarkitekt.
Ett av de viktigaste stegen mot bättre datadrivna beslut är demokratiseringen av data, så att informationen blir tillgänglig för alla beslutsfattare i organisationen, betonar Jasse Tykkyläinen.
En hel del organisationer har också påbörjat resan från Excel till traditionell datalagring i SQL-databaser, men i slutändan är det inte en särskilt skalbar lösning. Den är heller inte särskilt AI-anpassad.
– Många organisationer, särskilt de som är lite större, kan ha utmaningar med att det skapas olika sanningar från gemensamma data. Om det inte finns en gemensam datalagringsmöjlighet eller en dataplattform börjar plötsligt olika delar av organisationen ta fram sina egna lösningar. Då tolkas kanske samma data på olika sätt, säger Jasse Tykkyläinen.
Samma data till olika syften
Ett sätt att gallra bort isolerade system för bearbetning av olika arbetsbelastningar och därmed upprätta en enda datakälla är den relativt nya lösningen Data Lakehouse, eller datasjöhus med ett svenskt begrepp.
Det är en kombination av ett traditionellt informations- eller datalager (Data Warehouse), som sammanställer strukturerad information från flera olika källor, och en så kallad datasjö (Data Lake), som lagrar en stor mängd strukturerade, halvstrukturerade och ostrukturerade data i sitt ursprungliga råformat.
– I Lakehouse är lagring och beräkningskapacitet separerade. Det innebär i praktiken att om man har olika konsumtionsmönster för dessa data, antingen BI för affärsanalytiska ändamål, AI eller maskininlärning, så har man olika beräkningsmotorer separerade från datalagringen. Det är en väldigt viktig princip att man har bara en kopia av data, som kan användas till flera olika syften, säger Jasse Tykkyläinen.
Lättast att börja i molnet
Microsoft Fabric är ett exempel på en sådan heltäckande analysplattform, som förenklar datahantering och analys genom att kombinera olika tjänster och verktyg i samma plattform. I det fallet är allt redan färdigintegrerat, så det är bara att trycka på en knapp och köra.
– Det är det lättaste sättet att komma igång med det här och då helst i molnet, så att man kan fokusera på att skapa värde och inte så mycket på infrastrukturella delar, säger Jasse Tykkyläinen.
Det är också fullt möjligt att bygga en Data Lake-plattform on-prem med egna komponenter eller ha en hybrid miljö med vissa delar i molnet och andra i det egna datacentrat.
– En resa med Data Lakehouse kan påbörjas med en traditionell datalagerlösning. Sedan finns ju förmågorna där att ta sig vidare till AI, maskininlärning och realtidsdata. Det är en framtidssäkrad plattform som kommer att hålla över tid, säger Jasse Tykkyläinen.
Inlåsningseffekter undviks
En fördel med en Data Lakehouse-lösning, som till stor del bygger på öppen källkod, är att informationen ofta är lätt att flytta från en plattform till en annan. På så vis undviks inlåsningseffekter, framhåller Jasse Tykkyläinen.
– Med tanke på den politik som bedrivs i USA just nu och frågorna kring molnet är det här något som är viktigt att ha med sig. Du är inte lika beroende om något skulle hända. Då kan du byta till en annan leverantör eller hämta hem dina data.
Johan Ripgården betonar att man utan en modern plattform för datainsamling förr eller senare blir begränsad i sin AI-utveckling. Samtidigt vet han att det ofta kan vara lättare sagt än gjort att komma igång, att många fastnar i reaktiva analyser av sådant som redan har hänt.
– Då kan man behöva en liten boost: Hur många funktioner finns det egentligen i dag utifrån mer avancerade analysmetoder, prediktiva analyser eller för den delen nya datakällor som i vissa fall är ostrukturerade? På Atea erbjuder vi en halvdagsworkshop – Next-Level Analytics – där vi adresserar precis det här. Vi ger er inspiration och utgår från era nuvarande analyser för att se hur ni kan komma vidare.
Kontakta gärna oss om du vill veta mer.
- Flexibel: Data Lakehouse möjliggör lagring och analys av både strukturerad och ostrukturerad data, vilket ger stor flexibilitet i hur data kan hanteras.
- Snabb på realtidsanalyser: Ögonblicksbilder av verksamhetens prestationer här och nu kan skapas snabbt och effektivt.
- Skalbar: Utifrån behov är det lätt att skala lösningen upp eller ner.
- Centraliserad dataåtkomst: Lösningen hjälper till att etablera en enda sanningskälla och förenklar dataåtkomsten genom att centralisera olika datakällor.
- Flyttbar: Det går att flytta lösningen mellan olika plattformar, vilket minskar inlåsningseffekten.

