Netezza | |
---|---|
Type | offentlig virksomhed |
Børsnotering _ | NZ |
Grundlag | 2000 |
afskaffet | 2011 |
Årsag til afskaffelse | Absorberet af IBM |
Efterfølger | IBM |
Grundlæggere |
Jitindra Saxena Foster Hinshaw |
Beliggenhed | USA :Marlborough,Massachusetts |
Industri | datalogi ( ISIC :) 2620 _ |
Produkter | Hardware- og softwarekomplekser til databehandling |
omsætning | $190 millioner (2010) |
Antal medarbejdere | 469 (2010) |
Internet side | netezza.com |
Mediefiler på Wikimedia Commons |
Netezza ( urdu نتیجہ , "natija" - " resultat ") er en amerikansk virksomhed, der udvikler datavarehushardware og -softwaresystemer - klynger af relationelle databaseservere , der leverer massivt parallel behandling . Et karakteristisk træk ved alle Netezza-komplekser er brugen af programmerbare gate-arrays på databehandlingsknudepunkter, som giver datakomprimering og filtrering, og derved reducerer lageromkostninger og I/O- operationer ved eksekvering af datahentningsanmodninger [1] .
Virksomheden blev grundlagt i 2000, absorberet af IBM i 2010 , fuldt integreret i virksomheden siden 2011, hardware- og softwaresystemer blev produceret under IBM PureData for Analytics-mærket i perioden 2012-2014.
Grundlagt i 2000 ( under dot-com-krakket ) af den indisk-fødte iværksætter Jitindra Saxena og Foster Hinshaw med støtte fra venturekapitalisten Paul Feri ( Paul Feri ), som senere grundlagde investeringsselskabet Matrix partners ). Registreret i august 2000 i Delaware under navnet Intelligente data engines , og i oktober samme år skiftede navn til Netezza. I 1990'erne var Saxena medstifter af Applix og ledede det i lang tid (hovedproduktet af Applix er et multidimensionelt in-memory database management system TM1 , ejet af IBM Corporation siden 2008 ), Hinshaw var IT-konsulent hos systemintegratoren Keane . Saxena overtog som præsident for virksomheden, og Hinshaw som teknisk direktør. Virksomhedens hovedkvarter og udviklingsafdelinger gennem historien var placeret i byerne Massachusetts : Framingham , Marlborough , Cambridge , repræsentationskontorer var placeret i 12 lande.
Virksomheden fokuserede oprindeligt på udgivelsen af hardware- og softwaresystemer til datavarehuse , der implementerer massivt parallel behandling af store mængder information. I 2002 blev Performance Server -hardware- og softwaresystemer introduceret , som gør det muligt at behandle lager med en volumen på 4,5 - 18 TB [2] . Komplekserne blev samlet i form af brugsklare telekommunikationsskabe fyldt med den nødvendige server og switching udstyr med forudinstalleret software. Løsningens nøglefunktion var kombinationen af standard ProLiant -serverbaseret hardware med feltprogrammerbare gate-array- enheder , der giver effektiv lagring og højtydende databehandling, komprimeret og segmenteret efter lagerknudepunkter. Virksomheden lovede at reducere omkostningerne ved at behandle store relationelle storages for kunden betydeligt på grund af effektiv storage og tilbød komplekser til priser, der spænder fra $622.000 til $2,5 millioner, afhængigt af mængden af lagerplads [2] .
I 2002-2003 leverede virksomheden de første komplekser til kunder, hvoraf et er administrationen af staten Massachusetts [3] . I 2003 blev Hinshaw tildelt Infroworld magazine's "Innovator of the Year"-prisen for udvikling og implementering af Performance Server 8000 -komplekser [3] .
I 2003 tjente virksomheden 13,5 millioner dollars, i 2004 - 40 millioner dollars [4] , over de efterfølgende år af dets eksistens var den årlige stigning i omsætningen omkring 50 % [5] [6] (selvom Saxena i 2005 forventede en vækst på 150 % [7] ). Blandt 2004-kunderne er AT&T Wireless og den britiske afdeling af Orange Corporation [8] , mens Orange er opført som en af Netezzas investorer [9] .
I 2006 lykkedes det virksomheden at sælge 200 komplekser og tjente omkring 80 millioner dollars på et år, og så store virksomheder og organisationer som Amazon.com , det amerikanske Røde Kors , AOL [5] dukkede op blandt kunderne , virksomheden sluttede året med et nettotab på $14 millioner [6] . I juli 2007 gennemførte Netezza et børsnoteret udbud på New York Stock Exchange , vurderet som vellykket (værdien af aktierne steg med 45 % i løbet af placeringsperioden) [6] , indtil afskaffelsen af selskabets aktier blev handlet under ticker- symbolet NZ.
I begyndelsen af 2009 forlod Saxena virksomheden, Jim Baum , som tidligere ledede Boston-virksomheden Endeca (overtaget af Oracle i 2011), ledede Netezza. Fra 2010 er mere end 500 organisationer blevet rapporteret ved hjælp af Netezza-systemer [10] .
I september 2010 blev virksomhedens overtagelse af IBM annonceret for 1,7 milliarder dollars [11] . I løbet af 2011 blev integrationen i virksomheden gennemført, fra det tidspunkt distribueres al Netezza hardware og softwaresystemer gennem distributionskanalerne for IBM software, ordet "Netezza" blev brugt i kompleksernes navn i de første to år , siden slutningen af 2012 - kun som egenbetegnelse for databehandlingsteknologi . Siden 2014 er udgivelsen af nye komplekser baseret på Netezza-teknologier blevet afbrudt, og siden midten af 2019 er teknisk support til det solgte udstyr afbrudt [12] . I 2020, under mærket "Netezza" fra IBM, blev et skybaseret DBMS , kompatibelt med udgåede hardware- og softwaresystemer , leveret ved abonnement fra skyerne fra IBM Cloud eller Amazon Web Services [13] .
I 1980'erne blev specialiserede hardware- og softwaresystemer til distribueret databehandling produceret af Britton Lee og Teradata (i 1990 absorberede Teradata Britton Lee) [14] , og de prioriteres i tilgangen til en sådan implementering af stor behandling. mængder af data. Det er dog fremkomsten af Netezza-komplekser i begyndelsen af 2000'erne, der er kendt som identifikation af markedet for sådanne systemer [15] . Derudover er selve konceptet med specialiserede hardware- og softwaresystemer til datavarehuse ( engelsk data warehouse appliances ) forbundet med Netezza CTO Foster Hinshaw [16] .
Fra 2004, da virksomheden udgav suiter, der kunne håndtere op til 27 TB lagerplads, blev Netezzas løsning sammenlignet med både Teradata-pakker og ikke-specialiserede systemer baseret på Oracle- og IBM -software ; på det tidspunkt kunne Teradata-komplekser behandle hundredvis af terabyte, og kritik fra en konkurrent var baseret på vanskeligheden ved at opgradere systemet fra Netezza i tilfælde af en hurtig stigning i lagervolumen [17] .
I 2006-2007 henviste Gartner Netezza til gruppen af "visionære" på markedet for datalagringsløsninger inden for rammerne af den " magiske kvadrant " , der udarbejdes årligt for dette segment [18] , siden 2008 er Netezza blevet flyttet til markedslederne kvadrant. 2010 Magic Quadrant fremhæver Netezza som en direkte konkurrent til Oracle Exadata [10] .
Performance Server-komplekset blev produceret i 2002 og blev afsluttet med en række kontrolnoder, behandlingsknuder baseret på Hewlett-Packard ProLiant-servere , udstyret med feltprogrammerbare gate-array -computerenheder, der er ansvarlige for at interagere med lagerknudepunkter. Behandlingsknuderne opererede under Red Hat Enterprise Linux -operativsystemet og PostgreSQL -databasestyringssystemet [2] . Løsningen er implementeret i en delt intet - arkitektur , så datawarehouse-designeren skulle definere sharding-nøgler for at fordele den behandlede database på tværs af noder relativt jævnt .
De første komplekser behandlede op til 18 TB til en pris på $2,5 millioner (ca. $140.000 pr. terabyte). Den ældre model af 2004 behandlede lagerpladser på op til 27 TB og var udstyret med 650 diske og 676 processorer ; $370 tusind. Juniorkomplekset i 2004 behandlede 400 GB, indeholdt 60 processorer og kostede $300 tusinde [20] (ca. $770 tusind i form af terabyte).
De første TwinFin-komplekser brugte databehandlingsknuder baseret på Power- arkitektur-processorer , som blev leveret af en af IBM OEM -partnere [21] og, som i Performance Server, var udstyret med specialiserede behandlingsknuder baseret på programmerbare gate-arrays. I august 2009 blev behandlingsknuderne erstattet med to -socket IBM-bladeservere med Intel Xeon-processorer , feltprogrammerbare gate-arrays blev installeret en for hver Xeon-kerne [22] , disse noder blev placeret i en standard IBM BladeCenter-bladekurv. Takket være overgangen til x86-64-arkitekturen var det muligt at reducere omkostningerne ved en terabyte data til lagring markant - til et beløb under $20.000. [23] PostgreSQL brugt i TwinFin beskrives som "stærkt modificeret" [24] .
I de første år efter overtagelsen fortsatte IBM Corporation med at udvikle komplekserne. De vigtigste ændringer vedrørte indførelsen af forskellige softwareteknologier til " big data ": muligheden for MapReduce - behandling i databasen blev tilføjet gennem integrationen af Hadoop , statistisk behandling blev implementeret ved hjælp af SPSS og R direkte på klyngeknuderne. I kølvandet på rapporter om integrationen af den statistiske Revolution R -pakke i løsningen, som oprindeligt blev brugt til praktiske analyser over relationelle datavarehuse, blev komplekset i en af publikationerne karakteriseret som " Frankenstein for big data" [25] . I 2011 blev TwinFin omdøbt til IBM Netezza 1000, flere konfigurationer af komplekset blev produceret med antallet af snippets (par fra behandlingsknuden og programmerbar gate-array) fra 3 til 12 pr. kabinet og lagerkapacitet på 8 til 32 TB pr. , at kombinere op til 10 skabe understøttes. Vægten af et komplet skab er ca. 900 kg, energiforbruget er ca. 7,5 kW. Udgifterne til et komplet kabinet fra partnere i USA var ca. $320.000 [26] (ca. $10.000 pr. terabyte). Til udviklings- og testformål blev IBM Netezza 100-komplekser, tidligere Skimmer (1 kontrolknude og 1 snippet pr. 2,8 TB) leveret. Derudover tilføjede IBM IBM Netezza High Capacity Appliance-komplekset til linjen (to eller fire kabinetter med 8 eller 16 snippets til henholdsvis 288 og 576 TB).
I oktober 2012 rebrandede IBM, og fra det øjeblik og indtil ophøret i midten af 2010'erne blev komplekserne leveret under mærkenavnet "PureData for Analytics" som en del af PureSystems -linjen [27] , materialer om komplekserne bruger undertitlen "baseret på Netezza-teknologi" [28] , er udseendet af skabene blevet væsentligt ændret. Under N1001-indekset blev komplekser med henholdsvis 4, 7 og 14 snippets pr. kabinet og 32, 64, 128 TB lagerkapacitet leveret, hvilket fortsætter logikken i Netezza 1000-linjen, prisen på et komplet kabinet fra partnere i USA i begyndelsen af 2013 var omkring 360 tusind dollars [29] Under N2001-indekset blev højkapacitetskomplekser med 4-7 snippets og 96-192 TB pr. kabinet frigivet i 2014 som en fortsættelse af denne linje, N3001 komplekser med 2-7 snippets og op til 192 TB pr. kabinet blev frigivet, sammenlignet med den tidligere version blev antallet af kerner øget på snippet (20 kerner på behandlingsknuden og 16 kerner på det feltprogrammerbare gate-array, i modsætning til otte kerner på hver af komponenterne i kodestykket før).
Netezza blev anklaget for ulovligt at bruge en Massachusetts-baseret IISi (Intelligent Integration Systems) geospatial pakke, mens han udførte en ordre fra CIA om at skabe hardware og software til MQ - 1 Predator-dronen . Essensen af problemet var, at Netezza, efter at have modtaget et afslag fra IISi i kravet om at accelerere porteringen af pakken under TwinFin, hackede testversionen af pakken og selvstændigt integrerede den i dets hardware- og softwaremiljø. Det blev specifikt bemærket, at CIA var opmærksom på hacket, og kunden var klar over, at afvigelser i lokalitetsestimaterne i testversionen nåede op på 13 meter (i forhold til den stabile version, hvor der ikke var sådanne afvigelser), og det kunne føre til unødvendige tab under kampanvendelse af teknologi [30] . I november 2010 blev kravene imidlertid afgjort uden for retten [31] .