Dyk dybere: OneLake og Direct Lake i Microsoft Fabric

Lasse Valentini Jensen

Cloud Architect

Dyk dybere: OneLake og Direct Lake i Microsoft Fabric

I min introduktion til Microsoft Fabric kom jeg ind på et par af de grundlæggende byggeklodser, der gør det muligt at forene data og analyser i ét samlet miljø. Men for at virkelig forstå styrken ved platformen, er det værd at kigge nærmere på to centrale koncepter: OneLake og Direct Lake. Disse teknologier udgør rygraden i, hvordan Fabric revolutionerer dataopbevaring og -tilgængelighed. Lad os dykke dybere ned.

Dataintegration uden begrænsninger

Tænk på OneLake som en "lakehouse"-løsning, hvor alle dine data er samlet i én fælles struktur. Den fungerer som det universelle datalager for hele Microsoft Fabric-økosystemet. Fordelene ved OneLake gør det til en gamechanger for datadrevne organisationer.

1. Centraliseret dataopbevaring: OneLake samler alle data ét sted, uanset om det kommer fra forskellige kilder som Azure Data Lake, SQL-baserede systemer eller tredjepartstjenester.

2. Understøtter både struktureret og ustruktureret data: Struktureret data lagres i det åbne Delta Parquet-format, hvilket muliggør nem integration med andre systemer og værktøjer uden behov for komplicerede konverteringer. Ustruktureret data kan ligge i samme filsystem, så det nemt kan tilgås og behandles af Spark.

3. Indbygget versionering og governance: OneLake håndterer datastyring, adgangsrettigheder og versionering som en del af platformens kerne.

4. Data sharing uden kopiering: I stedet for at oprette kopier kan OneLake dele data direkte med andre services via standarder som Delta Sharing.

Praktisk eksempel:

Forestil dig, at du har data fra en CRM-platform, en ERP-løsning og en marketingplatform. Med OneLake kan alle disse datakilder kombineres uden at skulle flyttes fysisk. Det sparer lageromkostninger og forbedrer ydeevnen.

Direkte adgang til dine data

Mens OneLake tilbyder en centraliseret lagringsløsning, sørger Direct Lake for en revolutionerende måde at tilgå data på uden behov for traditionelle caching- eller importmekanismer.

Direct Lake giver direkte og realtidsadgang til data i OneLake uden behov for at kopiere eller cache dem i andre systemer. Dette er især vigtigt for scenarier med store datamængder, hvor performance er afgørende.

Derfor får man:

1. Ingen databevægelse: Du behøver ikke flytte eller duplikere data. Alt tilgås direkte fra OneLake.

2. Forbedret ydeevne: I modsætning til traditionel dataimport læser Direct Lake data direkte fra Delta Parquet-filer i OneLake. Dette eliminerer forsinkelser og unødvendige belastninger.

3. Integration med Power BI: Direct Lake arbejder tæt sammen med Power BI, så dashboards og rapporter kan opdateres hurtigere uden behov for data refresh.

Praktisk eksempel:

Hvis fx en global virksomhed bruger Power BI til deres salgsrapporter, og trækker data fra mange afdelinger på mange forskudte tidspunkter pga. tidsforskel så kan Direct Lake være en fordel da rapporterne opdateres i realtid uden forsinkelser, da dataen ikke skal caches. Samtidig understøtter en Direct Lake model langt større mængder data end en Import model til samme pris.

OneLake og Direct Lake: Ikke et valg, men en kombination

Det er vigtigt at forstå, at OneLake og Direct Lake ikke er alternativer, men komplementære teknologier. OneLake er det centrale lager for data, mens Direct Lake optimerer adgangen til disse data.

Brug OneLake som primær løsning, når:

I har brug for en centraliseret og skalerbar dataopbevaring
Dataen skal deles mellem flere teams og værktøjer uden komplekse kopieringsprocesser
Governance, versionering og sikkerhed er afgørende faktorer

Brug Direct Lake, når:

I arbejder med realtidsanalyser og har brug for direkte og umiddelbare dataopdatering
Performance og hastighed er kritiske for jeres rapporterings- og analyseværktøjer
Hvis I ønsker at undgå omkostningerne og kompleksiteten ved at flytte data til separate lagre eller caches

De fleste løsninger vil drage fordel af en kombination, hvor OneLake er fundamentet, og Direct Lake giver lynhurtig adgang for analyseværktøjer som Power BI.

Sådan kommer I i gang med OneLake og Direct Lake

1. Opsætning af OneLake i Microsoft Fabric: Når du aktiverer Fabric, er OneLake allerede konfigureret som standard datalake.

2. Brug af Direct Lake i Power BI: Du kan vælge Direct Lake som forbindelsestype, når du opretter rapporter. Dette kræver ingen ekstra konfiguration, da Power BI er bygget til at udnytte Direct Lake.

Væk med siloerne

OneLake og Direct Lake ændrer måden, vi tænker på dataarkitektur. I stedet for at bygge siloer og komplekse databevægelser, giver Microsoft Fabric med disse teknologier mulighed for:

Forenklet datastyring
Hurtigere analyser og beslutningstagning
Skalerbarhed uden unødvendig kompleksitet

Datauniversets Windows stifinder

OneLake kaldes ofte for "datauniversets Windows stifinder" – og er en enkel og velfungerende grænseflade til komplekse data. Kombineret med Direct Lake kan man så skabe nye standarder for realtidsindsigt.

Er I klar til at udforske potentialet?

Hvis I allerede bruger Microsoft Fabric eller overvejer det, er det også værd at udnytte styrken i OneLake og Direct Lake. Overvej, hvordan I kan omstrukturere jeres eksisterende dataprocesser og hvordan set-up’et skulle være hvis I skulle drage fordel af hurtigere, mere skalerbare løsninger.

Læs også min blogpost om Microsoft Fabric for at få et overblik over hele platformen og for at forstå, hvordan de forskellige komponenter spiller sammen.

Kan vi hjælpe jer med analyse og afklaring?

Vi er klar, hvis I ønsker en uforpligtende dialog.

Kontakt os her