Datamart

Data mart ( eng.  Data Mart ; andre oversættelsesmuligheder: specialiseret datavarehus, datakiosk, datamarked) - en delmængde (udsnit) af datavarehuset , som er en række tematisk, snævert fokuseret information, orienteret f.eks. brugere af én arbejdsgruppe eller afdeling [ 1] [2] .

Begrebet data marts

Konceptet med data marts blev foreslået af Forrester Research tilbage i 1991 . Ifølge forfatterne er datamarts  et sæt tematiske databaser (DB), der indeholder information relateret til visse aspekter af organisationens aktiviteter.

Konceptet har en række utvivlsomme fordele:

Men begrebet data marts har også meget alvorlige huller. I det væsentlige forudsætter det implementeringen af ​​et geografisk distribueret informationssystem med ringe kontrolleret redundans, men foreslår ikke måder at sikre integriteten og konsistensen af ​​de data, der er lagret i det.

Blandet koncept af data marts og datavarehuse

Idéen om at kombinere de to koncepter - datavarehuse og datamarts, tilhører tilsyneladende M. Demarest, som i 1994 foreslog at kombinere de to koncepter og bruge datavarehuset som en samlet integreret datakilde til datamarts.

Og i dag er det sådan en løsning på flere niveauer:

gradvist at blive de facto-standarden, hvilket muliggør den mest komplette implementering og brug af fordelene ved hver af tilgangene:

Den relationelle form for datarepræsentation, der bruges i den centrale virksomhedsdatabase, giver den mest kompakte måde at lagre data på. Moderne relationelle DBMS ved allerede, hvordan man arbejder med databaser med en størrelse af størrelsesordenen flere terabyte. Selvom et sådant centralt system normalt ikke kan give en online-tilstand til behandling af analytiske forespørgsler, når der anvendes nye metoder til indeksering og lagring af data, såvel som delvis denormalisering af tabeller, behandlingstiden for præregulerede forespørgsler (og regulerede procedurer for upload af data til multidimensionelle databaser kan også betragtes som sådan). ) er ganske acceptabelt.

Til gengæld giver brugen af ​​multidimensional DBMS i noderne på det lavere niveau den minimale behandlingstid og svar på ad hoc-brugeranmodninger. Derudover er det i nogle multidimensionelle DBMS muligt at lagre data både permanent (direkte i en multidimensionel database) og dynamisk (i løbet af en session) indlæse data fra relationelle databaser (baseret på regulerede forespørgsler).

Det er således muligt på permanent basis kun at gemme de data, der hyppigst efterspørges i en given node. For alle andre gemmes kun beskrivelser af deres struktur og programmer til udlæsning fra den centrale database. Selvom den indledende adgang til sådanne virtuelle data kan være ret langsom i responstid, giver denne løsning høj fleksibilitet og kræver billigere hardware.

Se også

Noter

  1. Data Mart er ikke lig med  datavarehus . Arkiveret fra originalen den 20. april 2011.
  2. Fon Silvers. Opbygning og vedligeholdelse af et datavarehus . - CRC Press, 2008. - S. 128. - ISBN 978-1-4200-6462-9 .