Netezza

Netezza
Type offentlig virksomhed
Børsnotering _ NZ
Grundlag 2000
afskaffet 2011
Årsag til afskaffelse Absorberet af IBM
Efterfølger IBM
Grundlæggere Jitindra Saxena
Foster Hinshaw
Beliggenhed  USA :Marlborough,Massachusetts
Industri datalogi ( ISIC :) 2620 _
Produkter Hardware- og softwarekomplekser til databehandling
omsætning $190 millioner (2010)
Antal medarbejdere 469 (2010)
Internet side netezza.com
 Mediefiler på Wikimedia Commons

Netezza ( urdu نتیجہ ‎, "natija"  - " resultat ") er en amerikansk virksomhed, der udvikler datavarehushardware og -softwaresystemer - klynger af relationelle databaseservere , der leverer massivt parallel behandling . Et karakteristisk træk ved alle Netezza-komplekser er brugen af ​​programmerbare gate-arrays på databehandlingsknudepunkter, som giver datakomprimering og filtrering, og derved reducerer lageromkostninger og I/O- operationer ved eksekvering af datahentningsanmodninger [1] .

Virksomheden blev grundlagt i 2000, absorberet af IBM i 2010 , fuldt integreret i virksomheden siden 2011, hardware- og softwaresystemer blev produceret under IBM PureData for Analytics-mærket i perioden 2012-2014.

Historie

Grundlagt i 2000 ( under dot-com-krakket ) af den indisk-fødte iværksætter Jitindra Saxena og Foster Hinshaw med støtte fra venturekapitalisten Paul Feri ( Paul Feri ), som senere grundlagde investeringsselskabet Matrix partners ). Registreret i august 2000 i Delaware under navnet Intelligente data engines , og i oktober samme år skiftede navn til Netezza. I 1990'erne var Saxena medstifter af Applix og ledede det i lang tid (hovedproduktet af Applix er et multidimensionelt in-memory database management system TM1 , ejet af IBM Corporation siden 2008 ), Hinshaw var IT-konsulent hos systemintegratoren Keane . Saxena overtog som præsident for virksomheden, og Hinshaw som teknisk direktør. Virksomhedens hovedkvarter og udviklingsafdelinger gennem historien var placeret i byerne Massachusetts : Framingham , Marlborough , Cambridge , repræsentationskontorer var placeret i 12 lande.

Virksomheden fokuserede oprindeligt på udgivelsen af ​​hardware- og softwaresystemer til datavarehuse , der implementerer massivt parallel behandling af store mængder information. I 2002 blev Performance Server -hardware- og softwaresystemer introduceret , som gør det muligt at behandle lager med en volumen på 4,5 - 18 TB [2] . Komplekserne blev samlet i form af brugsklare telekommunikationsskabe fyldt med den nødvendige server og switching udstyr med forudinstalleret software. Løsningens nøglefunktion var kombinationen af ​​standard ProLiant -serverbaseret hardware med feltprogrammerbare gate-array- enheder , der giver effektiv lagring og højtydende databehandling, komprimeret og segmenteret efter lagerknudepunkter. Virksomheden lovede at reducere omkostningerne ved at behandle store relationelle storages for kunden betydeligt på grund af effektiv storage og tilbød komplekser til priser, der spænder fra $622.000 til $2,5 millioner, afhængigt af mængden af ​​lagerplads [2] .

I 2002-2003 leverede virksomheden de første komplekser til kunder, hvoraf et er administrationen af ​​staten Massachusetts [3] . I 2003 blev Hinshaw tildelt Infroworld magazine's "Innovator of the Year"-prisen for udvikling og implementering af Performance Server 8000 -komplekser [3] .

I 2003 tjente virksomheden 13,5 millioner dollars, i 2004 - 40 millioner dollars [4] , over de efterfølgende år af dets eksistens var den årlige stigning i omsætningen omkring 50 % [5] [6] (selvom Saxena i 2005 forventede en vækst på 150 % [7] ). Blandt 2004-kunderne er AT&T Wireless og den britiske afdeling af Orange Corporation [8] , mens Orange er opført som en af ​​Netezzas investorer [9] .

I 2006 lykkedes det virksomheden at sælge 200 komplekser og tjente omkring 80 millioner dollars på et år, og så store virksomheder og organisationer som Amazon.com , det amerikanske Røde Kors , AOL [5] dukkede op blandt kunderne , virksomheden sluttede året med et nettotab på $14 millioner [6] . I juli 2007 gennemførte Netezza et børsnoteret udbudNew York Stock Exchange , vurderet som vellykket (værdien af ​​aktierne steg med 45 % i løbet af placeringsperioden) [6] , indtil afskaffelsen af ​​selskabets aktier blev handlet under ticker- symbolet NZ.

I begyndelsen af ​​2009 forlod Saxena virksomheden, Jim Baum , som tidligere ledede Boston-virksomheden Endeca (overtaget af Oracle i 2011), ledede Netezza. Fra 2010 er mere end 500 organisationer blevet rapporteret ved hjælp af Netezza-systemer [10] .

I september 2010 blev virksomhedens overtagelse af IBM annonceret for 1,7 milliarder dollars [11] . I løbet af 2011 blev integrationen i virksomheden gennemført, fra det tidspunkt distribueres al Netezza hardware og softwaresystemer gennem distributionskanalerne for IBM software, ordet "Netezza" blev brugt i kompleksernes navn i de første to år , siden slutningen af ​​2012 - kun som egenbetegnelse for databehandlingsteknologi . Siden 2014 er udgivelsen af ​​nye komplekser baseret på Netezza-teknologier blevet afbrudt, og siden midten af ​​2019 er teknisk support til det solgte udstyr afbrudt [12] . I 2020, under mærket "Netezza" fra IBM, blev et skybaseret DBMS , kompatibelt med udgåede hardware- og softwaresystemer , leveret ved abonnement fra skyerne fra IBM Cloud eller Amazon Web Services [13] .

Markedsposition

I 1980'erne blev specialiserede hardware- og softwaresystemer til distribueret databehandling produceret af Britton Lee og Teradata (i 1990 absorberede Teradata Britton Lee) [14] , og de prioriteres i tilgangen til en sådan implementering af stor behandling. mængder af data. Det er dog fremkomsten af ​​Netezza-komplekser i begyndelsen af ​​2000'erne, der er kendt som identifikation af markedet for sådanne systemer [15] . Derudover er selve konceptet med specialiserede hardware- og softwaresystemer til datavarehuse ( engelsk  data warehouse appliances ) forbundet med Netezza CTO Foster Hinshaw [16] .

Fra 2004, da virksomheden udgav suiter, der kunne håndtere op til 27 TB lagerplads, blev Netezzas løsning sammenlignet med både Teradata-pakker og ikke-specialiserede systemer baseret på Oracle- og IBM -software ; på det tidspunkt kunne Teradata-komplekser behandle hundredvis af terabyte, og kritik fra en konkurrent var baseret på vanskeligheden ved at opgradere systemet fra Netezza i tilfælde af en hurtig stigning i lagervolumen [17] .

I 2006-2007 henviste Gartner Netezza til gruppen af ​​"visionære" på markedet for datalagringsløsninger inden for rammerne af den " magiske kvadrant " , der udarbejdes årligt for dette segment [18] , siden 2008 er Netezza blevet flyttet til markedslederne kvadrant. 2010 Magic Quadrant fremhæver Netezza som en direkte konkurrent til Oracle Exadata [10] .

Performance Server

Performance Server-komplekset blev produceret i 2002 og blev afsluttet med en række kontrolnoder, behandlingsknuder baseret på Hewlett-Packard ProLiant-servere , udstyret med feltprogrammerbare gate-array -computerenheder, der er ansvarlige for at interagere med lagerknudepunkter. Behandlingsknuderne opererede under Red Hat Enterprise Linux -operativsystemet og PostgreSQL -databasestyringssystemet [2] . Løsningen er implementeret i en delt intet - arkitektur , så datawarehouse-designeren skulle definere sharding-nøgler for at fordele den behandlede database på tværs af noder relativt jævnt . 

De første komplekser behandlede op til 18 TB til en pris på $2,5 millioner (ca. $140.000 pr. terabyte). Den ældre model af 2004 behandlede lagerpladser på op til 27 TB og var udstyret med 650 diske og 676 processorer ; $370 tusind. Juniorkomplekset i 2004 behandlede 400 GB, indeholdt 60 processorer og kostede $300 tusinde [20] (ca. $770 tusind i form af terabyte).

Twin Fin

De første TwinFin-komplekser brugte databehandlingsknuder baseret på Power- arkitektur-processorer , som blev leveret af en af ​​IBM OEM -partnere [21] og, som i Performance Server, var udstyret med specialiserede behandlingsknuder baseret på programmerbare gate-arrays. I august 2009 blev behandlingsknuderne erstattet med to -socket IBM-bladeservere med Intel Xeon-processorer , feltprogrammerbare gate-arrays blev installeret en for hver Xeon-kerne [22] , disse noder blev placeret i en standard IBM BladeCenter-bladekurv. Takket være overgangen til x86-64-arkitekturen var det muligt at reducere omkostningerne ved en terabyte data til lagring markant - til et beløb under $20.000. [23] PostgreSQL brugt i TwinFin beskrives som "stærkt modificeret" [24] .

I de første år efter overtagelsen fortsatte IBM Corporation med at udvikle komplekserne. De vigtigste ændringer vedrørte indførelsen af ​​forskellige softwareteknologier til " big data ": muligheden for MapReduce - behandling i databasen blev tilføjet gennem integrationen af ​​Hadoop , statistisk behandling blev implementeret ved hjælp af SPSS og R direkte på klyngeknuderne. I kølvandet på rapporter om integrationen af ​​den statistiske Revolution R -pakke i løsningen, som oprindeligt blev brugt til praktiske analyser over relationelle datavarehuse, blev komplekset i en af ​​publikationerne karakteriseret som " Frankenstein for big data" [25] . I 2011 blev TwinFin omdøbt til IBM Netezza 1000, flere konfigurationer af komplekset blev produceret med antallet af snippets (par fra behandlingsknuden og programmerbar gate-array) fra 3 til 12 pr. kabinet og lagerkapacitet på 8 til 32 TB pr. , at kombinere op til 10 skabe understøttes. Vægten af ​​et komplet skab er ca. 900 kg, energiforbruget er ca. 7,5 kW. Udgifterne til et komplet kabinet fra partnere i USA var ca. $320.000 [26] (ca. $10.000 pr. terabyte). Til udviklings- og testformål blev IBM Netezza 100-komplekser, tidligere Skimmer (1 kontrolknude og 1 snippet pr. 2,8 TB) leveret. Derudover tilføjede IBM IBM Netezza High Capacity Appliance-komplekset til linjen (to eller fire kabinetter med 8 eller 16 snippets til henholdsvis 288 og 576 TB).

I oktober 2012 rebrandede IBM, og fra det øjeblik og indtil ophøret i midten af ​​2010'erne blev komplekserne leveret under mærkenavnet "PureData for Analytics" som en del af PureSystems -linjen [27] , materialer om komplekserne bruger undertitlen "baseret på Netezza-teknologi" [28] , er udseendet af skabene blevet væsentligt ændret. Under N1001-indekset blev komplekser med henholdsvis 4, 7 og 14 snippets pr. kabinet og 32, 64, 128 TB lagerkapacitet leveret, hvilket fortsætter logikken i Netezza 1000-linjen, prisen på et komplet kabinet fra partnere i USA i begyndelsen af ​​2013 var omkring 360 tusind dollars [29] Under N2001-indekset blev højkapacitetskomplekser med 4-7 snippets og 96-192 TB pr. kabinet frigivet i 2014 som en fortsættelse af denne linje, N3001 komplekser med 2-7 snippets og op til 192 TB pr. kabinet blev frigivet, sammenlignet med den tidligere version blev antallet af kerner øget på snippet (20 kerner på behandlingsknuden og 16 kerner på det feltprogrammerbare gate-array, i modsætning til otte kerner på hver af komponenterne i kodestykket før).

Kritik

Netezza blev anklaget for ulovligt at bruge en Massachusetts-baseret IISi (Intelligent Integration Systems) geospatial pakke, mens han udførte en ordre fra CIA om at skabe hardware og software til MQ - 1 Predator-dronen . Essensen af ​​problemet var, at Netezza, efter at have modtaget et afslag fra IISi i kravet om at accelerere porteringen af ​​pakken under TwinFin, hackede testversionen af ​​pakken og selvstændigt integrerede den i dets hardware- og softwaremiljø. Det blev specifikt bemærket, at CIA var opmærksom på hacket, og kunden var klar over, at afvigelser i lokalitetsestimaterne i testversionen nåede op på 13 meter (i forhold til den stabile version, hvor der ikke var sådanne afvigelser), og det kunne føre til unødvendige tab under kampanvendelse af teknologi [30] . I november 2010 blev kravene imidlertid afgjort uden for retten [31] .

Noter

  1. Prickett-Morgan, 2010 , Den specielle sauce i Netezza-gearet er et feltprogrammerbart gate-array (FPGA), der håndterer datakomprimering og dekompression, når det går til og fra disken, og derved fremskynder gennemløbet, samt giver sofistikeret datafiltrering så kun de relevante dele af et kæmpe datasæt videregives til X64-motorerne for at køre SQL-forespørgslen.
  2. 1 2 3 Whiting, Rick Startup Netezza skubber rabat på datavarehusprodukter. Virksomheden lover apparater, som den siger kan håndtere terabyte-skala business-intelligence apps 10 til 20 gange hurtigere end traditionelle systemer til halvdelen af  ​​prisen . informationsuge . UBM TechWeb (23. september 2002). Hentet 11. juli 2012. Arkiveret fra originalen 12. januar 2013.
  3. 1 2 Rash, Wayne 2003 InfoWorld Innovator: Foster D. Hinshaw.  Netezza CTO brugte aerodynamik til at opfinde en storstilet databaseapparat, der håndterer data på en helt ny måde . Inforworld (23. marts 2003). - "Nogle af de største organisationer, inklusive Commonwealth of Massachusetts, fandt ud af, at BI (business intelligence) ikke var så nyttig, hvis den ikke kunne håndtere alle deres data." Hentet 8. juli 2012. Arkiveret fra originalen 25. september 2012.
  4. Lyons, 2004 , Jitendra Saxenas lille computerfirma, Netezza, vil sælge hele $40 millioner i år.
  5. 12 Netezza Corporation. Offentligt  udbud . Edgar, Form S-1 . United States Securities and Exchange Commission (22. marts 2007). Hentet 8. juli 2012. Arkiveret fra originalen 25. september 2012.
  6. 1 2 3 Vance, Ashley Netezza henter masser af kontanter i IPO  . Registret (21. juli 2007). Hentet 8. juli 2012. Arkiveret fra originalen 25. september 2012.
  7. Lyons, 2004 , Saxena forventer, at hans salg vil vokse 150% i 2005 til 100 millioner dollars.
  8. Lyons, 2004 , AT&T Wireless og Orange UK valgte Netezza-bokse til at analysere kundeopkald.
  9. Lyons, 2004 , Orange er også investor i Netezza.
  10. 1 2 Feinberg, Anders; Beyer, Mark A. Magic Quadrant for Data Warehouse Database Management Systems  . Magisk kvadrant . Gartner (28. januar 2011). — “Opkøbet af Netezza i slutningen af ​​2010 giver IBM en færdiglavet Linux-kompatibel datavarehus-enhed, som konkurrerer direkte med Oracles Exadata. Yderligere indikerer samtaler med Gartner-kunder, at Netezza fortsætter med at konkurrere godt på både pris og ydeevne mod Oracles Exadata." Hentet 11. juli 2012. Arkiveret fra originalen 25. september 2012.
  11. Nutall, Chris . IBM køber Netezza for 1,7 mia. USD i kontanter  (engelsk) (HTML), Financial Times  (20. september 2010). Hentet 8. juli 2012.
  12. Max Smolaks. RIP Netezza, IBMs FPGA-drevne data warehousing drøm . Engang mægtig virksomhed dræbt af cloud computing . Registret (3. juli 2019) .
  13. Lindsay Clark. IBM genopliver Netezza data warehousing kit i skyen, som vil glæde kunder midtvejs i migreringen . Registret (27. maj 2020).
  14. Chernyak, Leonid. Big Data — Ny teori og praksis  // Åbne systemer. DBMS . - 2011. - Nr. 10 . — ISSN 1028-7493 .
  15. Ponya, 2010 , Generelt betragtes Terradatas kerneproduktlinje som moderen til alle datavarehusapparater, selvom udtrykket ikke var forbundet med produktudbud. Større interesse for apparater til datavarehuse steg med fremkomsten af ​​Netezza i begyndelsen af ​​2000'erne.
  16. Ponya, 2010 , Begrebet datavarehusapparat blev opfundet af Foster Hinshow.
  17. Lyons, 2004 , ledere hos Teradata afviser Netezza og siger, at dens kasser er svære at opgradere og for ringe til at håndtere enorme datavarehuse som dem, det har bygget til Wal-Mart, FedEx og Dell. Teradata-systemer kan håndtere hundredvis af terabyte.
  18. Beasty, Colin Teradata topper Gartner Magic Quadrant for Database Management  . Destination CRM . CRM Magazine (26. oktober 2007). — “Netezza, som var stort set uændret i forhold til sin tidligere rating; i år halter virksomheden blot lidt efter Sybase med hensyn til at eksekvere, men knirker forbi med hensyn til fuldstændigheden af ​​sin vision." Hentet 11. juli 2012. Arkiveret fra originalen 25. september 2012.
  19. Lyons, 2004 , Netezzas topmodel kan prale af 650 harddiske og 676 mikroprocessorer. Den rummer 27 terabyte data og koster 10 millioner dollars.
  20. Lyons, 2004 , Low-end-modellen, til $300.000, bruger 60 mikroprocessorer og rummer 400 gigabyte.
  21. Prickett-Morgan, 2011 , De originale Netezza-apparater var baseret på Power-arkitektur (og kom ikke fra IBM, men en af ​​dens OEM'er).
  22. Prickett-Morgan, 2010 , IBM's BladeCenter-chassis og HS22 Xeon-bladeservere med to sockets og plunking af FPGA'erne (en pr. Xeon-kerne) på en ledsagende blade.
  23. Monash, Kurt Netezza ændrer sin hardwarearkitektur og sænker priserne i overensstemmelse hermed  . Monash Research (30. juli 2009). Hentet: 13. juli 2012.
  24. Prickett-Morgan, 2010 , … stærkt tilpasset PostgreSQL-database.
  25. Harris, Derrick . IBM skaber Big Data Frankenstein med Netezza-R Fusion  (engelsk) , The New York Times  (2011-03-141). Hentet 19. november 2011.
  26. Netezza 1000-12  . Tvillingerne (13. juli 2012). Hentet 13. juli 2012. Arkiveret fra originalen 25. september 2012.
  27. Pricket Morgan, Timothy. IBM tager imod Oracle med PureData-apparater.  Rebadging Netezza varehuse og Smartie kasser . Th Register (10. oktober 2012). Dato for adgang: 16. februar 2013. Arkiveret fra originalen 14. marts 2013.
  28. Drevet af Netezza-teknologi
  29. PureData System Analytics N1001-015  . Tvillingerne (16. februar 2013). Dato for adgang: 16. februar 2013. Arkiveret fra originalen 14. marts 2013.
  30. Williams, Christopher CIA brugte "ulovlig, unøjagtig kode til at målrette dræbende droner". "De vil dræbe folk med software, der ikke virker"  (engelsk) . Registret (24. oktober 2010). Hentet 11. juli 2012. Arkiveret fra originalen 25. september 2012.
  31. Williams, Christopher Netezza betaler for at lukke CIA-dræberens drone-sag. Defekt målretningsrække  dæmpet . Registret (11. november 2010). Hentet 11. juli 2012. Arkiveret fra originalen 25. september 2012.

Litteratur