Kolonnelagring

Den stabile version blev tjekket ud den 7. august 2022 . Der er ubekræftede ændringer i skabeloner eller .

Kolumnær lagring  er en måde at organisere lagring i databaser på , når data ikke lagres linje for linje (linje for linje), men kolonne for kolonne. Det er mest effektivt til datavalgsoperationer fra et lille undersæt af kolonner med deres efterfølgende kolonne-for-kolonne-behandling, såvel som til datakomprimering (da kolonner ofte gemmer duplikerede eller lukkede data). Indsættelse af et stort antal rækker kan implementeres effektivt, men enkeltindsættelses-, opdaterings- og sletningsoperationer er mindre effektive i kolonnelagring end i rækkelagring.

Columnar DBMS  er et databasestyringssystem, der understøtter søjleformet lagring. Traditionelle relationelle DBMS'er bruger typisk rækkelagring, hvilket er effektivt til OLTP - scenarier, menskolonnelagring til OLAP -arbejdsbelastninger har en tendens til at give bedre ydeevne.

Relationelle kolonneformede DBMS'er inkluderer Teradata Database , Netezza , Sybase IQ , kdb , C-Store (og dens efterkommer Vertica ), Greenplum , Hana , ParAccel (og dens efterkommer Amazon Redshift ), MonetDB , ClickHouse . En række traditionelle relationelle DBMS'er implementerer kolonnelagring ( Oracle Database , MS SQL Server , MariaDB ), eller der er tilføjelser (f.eks. Citus til PostgreSQL ). De vigtigste Hadoop-formater - RCFIle , ORC , Parquet , Apache Arrow  - bruger også søjleformet organisation. Columnar DBMS er en række systemer fokuseret på at arbejde med tidsserier ( InfluxDB , Apache Druid ).

Links