Database design

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 4. februar 2021; checks kræver 9 redigeringer .

Databasedesign  er processen med at skabe et databaseskema og bestemme de nødvendige integritetsbegrænsninger .

Grundlæggende opgaver i databasedesign

Hovedmål:

Nøgletrin i databasedesign

Konceptuelt (infologisk) design

Konceptuelt (infologisk) design  er konstruktionen af ​​en semantisk model af emneområdet, det vil sige en informationsmodel af det højeste abstraktionsniveau. En sådan model er skabt uden at fokusere på nogen bestemt DBMS og datamodel . Udtrykkene "semantisk model", "konceptuel model" og "infologisk model" er synonyme. Derudover kan ordene "databasemodel" og "domænemodel" (f.eks. "begrebsbasemodel" og "begrebsdomænemodel") bruges lige meget i denne sammenhæng, da en sådan model både er et billede af virkeligheden og en billede af en designdatabase for denne virkelighed.

Den konkrete form og indhold af den konceptuelle databasemodel er bestemt af det formelle apparat, der er valgt hertil. Grafiske notationer svarende til ER-diagrammer er almindeligt anvendte .

Den mest almindelige konceptuelle databasemodel inkluderer:

Logisk (datalogisk) design

Logisk (datalogisk) design  - oprettelse af et databaseskema baseret på en specifik datamodel , for eksempel en relationel datamodel . For en relationel datamodel er en datalogisk model et sæt af relationsskemaer , der normalt angiver primærnøgler såvel som "links" mellem relationer, som er fremmednøgler .

Transformationen af ​​en konceptuel model til en logisk model udføres som regel efter formelle regler. Dette trin kan stort set automatiseres.

På det logiske designstadium tages der hensyn til specifikationerne for en bestemt datamodel, men der tages muligvis ikke højde for detaljerne ved et bestemt DBMS.

Fysisk design

Fysisk design  - oprettelse af et databaseskema til et specifikt DBMS . De specifikke specifikationer for et bestemt DBMS kan omfatte begrænsninger for navngivning af databaseobjekter, begrænsninger på understøttede datatyper osv. Derudover omfatter de specifikke specifikationer for et bestemt DBMS under fysisk design valget af beslutninger relateret til det fysiske datalagringsmiljø (denne valg af metoder til styring af diskhukommelse, adskillelse af databasen efter filer og enheder, dataadgangsmetoder), oprettelse af indekser osv.

Resultatet af det fysiske design af det logiske kredsløb ovenfor i SQL-sproget kan være følgende script:

OPRET TABEL , HVIS IKKE FINDER Afdeling ( - Afdelings- id INT IKKE NULL , navn VARCHAR ( 45 ), PRIMÆR NØGLE ( id ) ); OPRET TABEL , HVIS IKKE FINDER Gruppe ( id INT IKKE NULL , navn VARCHAR ( 45 ) , afgangs_id INT IKKE NULL , UNIKT INDEX depart_id_UNIQUE ( depart_id ASC ) , PRIMÆR NØGLE ( id , afgangs_id ) , CONSTRAINT_ afgang NØGLE ( depart_id_depart_k ) ( depart_id_depart_k ) ) ); OPRET TABEL , HVIS IKKE FINDER Elev ( fornavn VARCHAR ( 16 ) IKKE NULL , efternavn VARCHAR ( 45 ) IKKE NULL , e- mail VARCHAR ( 255 ), group_id INT NOT NULL , PRIMÆR NØGLE ( efternavn , fornavn , fornavn , gruppe_id , gruppe_id , gruppe_id , gruppe_id ) , BEGRÆNSNING group_fk UDENLANDSKE NØGLE ( group_id ) REFERENCER Group ( id ) ;

Normalisering

Ved design af relationelle databaser udføres normalt såkaldt normalisering.

Entitetsforholdsmodeller

" Entity -Relationship model" eller ER-modellen foreslået af P. Chen [1] i 1976, er den mest berømte repræsentant for klassen af ​​semantiske (konceptuelle, infologiske) domænemodeller .  ER-modellen præsenteres normalt i grafisk form ved at bruge P. Chens originale notation, kaldet ER-diagrammet , eller ved at bruge andre grafiske notationer ( Crow's Foot , Information Engineering , etc.).

De vigtigste fordele ved ER-modeller:

  • sigtbarhed;
  • modeller giver dig mulighed for at designe databaser med et stort antal objekter og attributter;
  • ER-modeller er implementeret i mange database-computerstøttede designsystemer (f.eks. ERWin).

Hovedelementerne i ER-modeller:

  • objekter (enheder);
  • objekt attributter;
  • forbindelser mellem objekter.

En enhed er et domæneobjekt, der har attributter.

Forholdet mellem enheder er karakteriseret ved:

  • forbindelsestype (1:1, 1:N, N:M);
  • medlemsklasse. En klasse kan være påkrævet eller valgfri. Hvis hver forekomst af en enhed deltager i en relation, er medlemsklassen obligatorisk, ellers er den valgfri.

Semantiske modeller

En semantisk model (konceptuel model, infologisk model) er en domænemodel designet til at repræsentere et domænes semantik på det højeste abstraktionsniveau. Dette betyder, at behovet for at bruge de "lavt niveau"-koncepter, der er forbundet med detaljerne i den fysiske repræsentation og lagring af data, elimineres eller minimeres.

Dato KJ Introduktion til databasesystemer. - 8. udg. - M .: "Williams", 2006 :

Semantisk modellering har været genstand for intens forskning siden slutningen af ​​1970'erne. Hovedmotivet for sådanne undersøgelser (det vil sige problemet, som forskerne forsøgte at løse) var følgende kendsgerning. Faktum er, at databasesystemer normalt har meget begrænset viden om betydningen af ​​de data, der er lagret i dem. Oftest tillader de kun manipulation af data af visse simple typer og definerer nogle simple integritetsbegrænsninger, der pålægges disse data. Enhver mere kompleks fortolkning er overladt til brugeren. Det ville dog være fantastisk, hvis systemerne kunne have lidt mere information og lidt mere intelligent respons på brugerønsker, samt understøtte mere komplekse (det vil sige højere niveau) brugergrænseflader.
[…]
Ideerne til semantisk modellering kan være nyttige som et databasedesignværktøj, selvom de ikke er direkte understøttet i DBMS.

Den mest kendte repræsentant for klassen af ​​semantiske modeller er enhedsrelationsmodellen (ER-modellen).

Litteratur

  • Dato CJ Introduktion til databasesystemer = Introduktion til databasesystemer. - 8. udg. - M . : "Williams" , 2006. - 1328 s. — ISBN 0-321-19784-4 .
  • Kogalovsky M.R. Perspektive teknologier for informationssystemer. - M . : DMK Tryk; IT Co., 2003. - 288 s. — ISBN 5-279-02276-4 .
  • Kogalovsky M.R. Database Technology Encyclopedia. - M .: Finans og statistik , 2002. - 800 s. — ISBN 5-279-02276-4 .
  • Kuznetsov SD Grundlæggende om databaser. - 2. udg. - M. : Internet University of Information Technologies; BINOMIAL. Videnlaboratoriet, 2007. - 484 s. - ISBN 978-5-94774-736-2 .
  • Connolly T., Begg K. Databaser. Design, implementering og support. Teori og praksis = Databasesystemer: En praktisk tilgang til design, implementering og ledelse. - 3. udg. - M . : "Williams" , 2003. - 1436 s. — ISBN 0-201-70857-4 .
  • Garcia-Molina G., Ulman J., Widom J. Databasesystemer. Fuldt kursus. - M . : "Williams" , 2003. - 1088 s. — ISBN 5-8459-0384-X .

Se også

Links

Noter

  1. Peter Chen. Entity-relationship-modellen er et skridt i retning af et samlet syn på data . Hentet 28. december 2009. Arkiveret fra originalen 20. december 2009.