2023-05-02

Håller vi på att drunkna i det nya guldet?

Att data är det nya guldet har länge varit känt, den som har rätt data vid rätt ögonblick kan ta rätt beslut som är avgörande för många verksamheter idag.

Anders Rönnberg
Concept Manager

Detta gör att allt fler och fler tjänster tas fram där vi kan extrahera data för att sedan behandlas och presenteras. Google och Meta bygger ju hela sin existens på detta tillexempel och alla AI modeller som skapas, kräver enorma mängder data för att tränas och bli relevanta. Som exempel kan nämnas att för att träna självkörande bilar till nivå 5, dvs helt självkörande utan mänsklig interaktion, så samlas det i fordonen in 20 terabyte data (TB) per timme. Detta skall sedan lagras och bearbetas för att förbättra modellen. Det blir ju snabbt väldigt stora volymer som måste lagras, bearbetas och presenteras. Just ostrukturerade data är ju det som förväntas öka mest framgent. Tänk sensorer, loginsamling, bilder, video osv.

Om tillväxten håller i sig så tror man att vi år 2030 kommer vi producera mer än 1 yottabyte (*) data. Vi pratar i dag oftast om terabyte (TB) som mätvärde när vi pratar lagringsvolymer, så för att få ett perspektiv på storleken här så är alltså 1 yottabyte (YB) lika med 1 trillion TB.

Hur kan då det som räknas som det nya guldet vara ett problem?

Tittar man på denna ofantliga datamängd som produceras och mängden data som nyttjas och läses så börjar man förstå att vi har ett stort problem i våra händer framöver. Enligt en studie från IDC & hårddisktillverkaren Seagate (**) så används aldrig 68% av den data som vi genererar. Det är väldigt mycket data som kräver energi dvs CO2 utsläpp för att sedan aldrig användas. Mer data produceras per timme idag än vad som genererades per år för 2 decennier sedan.

Våra samlade datacenter över jorden nyttjar 2% av energiresurserna som produceras. 2030 så estimerar man att denna siffra kommer vara uppe i 8%. Vi har en gigantisk deponi av data som sitter i våra datacenter, konsumerar energi och därmed utsläpp. Jämför man då med att all världens jordbruk och matframställan beräknas nyttja 30% av energiresurserna så förstår vi proportionerna som kommer att krävas för att driva våra datacenters.

Branschen har länge jobbat datareducerande tekniker så som de-duplicering, större hårddiskar, flash teknik osv men detta är tyvärr inte tillräckligt. Vi måste ta ägandeskap och ansvar för den data vi genererar. Idag sker det allt för ofta att man tillför mer lagringsyta än att rensa vilket gör att lagringsberget bara växer. Frågar man verksamheten, så är de oftast medvetna om att det är de som genererar all denna data, men att det är it som ansvarar för den. It-avdelningen å andra sidan säger att de bara ser till att datan är tillgänglig, men användarna äger den. Här har vi den något förenklade förklaringen till varför lagringsberget ökar.

Till 2030 föreslår man inom EU att vi skall minska vårt energiutnyttjande med 9% jämfört med år 2020. Det finns även en tydlig trend inom EU som går mot en mycket striktare modell för att redovisa CO2-avtryck ifrån datacenter. Detta kommer påverka alla som hanterar datacenter över en viss storlek och därmed kommer ställa mycket högre krav på användning av fosilfri el, energiåtervinning av värme, återbruk av it-utrustning och andra energieffektiviserings initiativ.

Vad kan vi göra här och nu för att minska energiutnyttjande?

Det är känt sedan länge att modernare teknik är mer energieffektiv än äldre sådan. Tidigare har vi försökt leva så länge det bara går med våra investeringar för att maximera.

Ny utrustning är snabbare, mer energieffektiv och har bättre densitet dvs. platsen de tar i anspråk är mindre. Att de publika molnleverantörerna vill vara en del av denna lösning är tydligt. Det är få organisationer som har en effektivare driftmiljö än de storskaliga leverantörerna och man kan därmed göra en direkt vinst beträffande energieffektivisering.

Kanske kan den nya konsumtionsmodellen som många våra hårdvaruleverantörer numera erbjuder vara en del av denna lösning? Då man konsumerar it med Opex istället för Capex och livscykelhanteringen av hårdvaran sköts via tjänsten så kommer troligen hårdvaran att vara utbytt före en traditionell investering, vilket förhoppningsvis ger en mer energieffektivare miljö. Nyare plattformar bygger idag uteslutande på NVMe baserad lagring som är mångt mycket mer energieffektiva än traditionella spinnande diskar.

Organisationer måste ha hållbarhetsfrågor även för datacenter på agendan. Utarbeta en strategi när energieffektivisering är med, ställ krav på leverantörer vad gäller energieffektivisering.

Vi måste finna en långsiktig lösning på det berg av data vi håller på att bygga.
Låt data bli det nya guldet, inte den nya energitjuven!

Mer tips på energioptimering i datacenter finns här

(*) Info om Yottabyte https://sv.wikipedia.org/wiki/Yottabyte
(**) Rethink Data | Seagate UK