Cloudera

Cloudera Inc.
Type offentlig virksomhed
Børsnotering _ NYSE : CLDR
Grundlag 2009
Grundlæggere Christophe Biscilla,
Amr Awadalla,
Jeffrey Hammerbacher,
Michael Olson
Beliggenhed  USA :Palo Alto
Nøgletal Reilly, Tom (CEO),
Doug Cutting (Chief Architect)
Industri softwareudvikling ( ISIC :) 6201 _
Produkter Kommerciel version af Hadoop , Cloudera Impala
omsætning $301 millioner (2018)
Driftsresultat -389 millioner USD (tab, 2018)
Nettoresultat -386 millioner USD (tab, 2018)
Brug af store bogstaver $2,66 milliarder (7. september 2018) [1]
Internet side cloudera.com
 Mediefiler på Wikimedia Commons

Cloudera  er et amerikansk firma, der udvikler Apache Hadoop- distributioner og en række Hadoop -økosystemsoftwareprodukter .

Virksomhedens forretningsmodel er blevet sammenlignet med Red Hats forretning  - Cloudera skaber distributioner af softwareprodukter til organisationer baseret på gratis software og tjener penge ved at levere teknisk support til de leverede løsninger [2] [3] . Med boomet i " big data "-teknologier er Cloudera gentagne gange blevet anerkendt som en af ​​de mest lovende virksomheder, der er i stand til at løse problemer i sin klasse [4] [5] .

I 2018 absorberede det hovedkonkurrenten på Hadoop-distributionsmarkedet, det amerikanske firma Hortonworks .

Historie

Virksomheden blev grundlagt i oktober 2008 i Burlingame ( Californien ) med en startkapital på $5 millioner, hovedmålet med virksomheden var kommercialiseringen af ​​Hadoop- projektet . Grundlæggerne af virksomheden er Christophe Bischiglia ,  som tidligere har arbejdet hos Google , Amr Awadallah ( Amr Awadallah , Vice President for Yahoo Corporation , ansvarlig for analysesystemer og datalagring), Jeffrey Hammerbacher ( Jeff Hammerbacher , Hive - projektleder hos Facebook ) og Michael Olson , vicepræsident for Oracle Corporation , tidligere administrerende direktør for Sleepecat , som udviklede og udviklede Berkeley DB og blev absorberet i 2006 af Oracle) [6] . Hammerbacher arrangerede startfinansiering til projektet fra Accel Partners , hvor Olson overtog virksomheden. I alt blev der rejst 11 millioner dollars i den indledende fase, og udover Accel er Greylock Partners og business angels Gideon Yu og Caterina Fake opført blandt investorerne [ 7 ] .

Blandt de ansatte, der blev ansat i de første måneder, var Hadoop-skaberne Doug Cutting og  Mike Cafarella , tidligere administrerende direktører for VMware ( Diane Green ) og MySQL AB ( Marten Mikos ) [8] . Takket være Cuttings flytning til Cloudera er virksomheden blevet beskrevet som "den nye flagbærer af Hadoop" [9] .

I 2009 blev Biscilla placeret på en femteplads på Businessweeks Top 22 Young Tech Entrepreneurs-liste [10] , og Hammerbacher på en syvendeplads (ud af 15) i 2010 . I Biscilla-nomineringen blev Cloudera beskrevet som et servicefirma, der ydede teknisk rådgivning om Hadoop, mens Hammerbachers bidrag i 2010 blev bemærket som en transformation af virksomhedens forretning, hvilket gjorde den til en leverandør af replikerbar software til organisationer [11] .

I november 2011 modtog virksomheden yderligere finansiering i et beløb på $40 millioner [12] , i december 2012 - yderligere $65 millioner [13] , blandt investorerne i de næste runder er Ignition Partners , Greylock , Accel , Meritech Capital Partners og In -Q-Tlf [ 14] [13] .

I oktober 2012 introducerede virksomheden Impala -produktet , som giver SQL -adgang til data i en Hadoop-drevet klynge, fremkomsten af ​​et sådant produkt blev mødt som en overraskelse, da virksomhedernes fremherskende retorik fokuserede på "big data". "teknologier var opgivelsen af ​​traditionelle teknologier baseret på SQL ( eng.  old SQL , i overensstemmelse med " old school " - old school ) [15] .

I juni 2013 blev Tom Reilly inviteret til stillingen som administrerende direktør , efter at have ført to teknologivirksomheder til overtagelse af store aktører ( MDM-systemproducenten Trigo blev købt af IBM i 2004, og ArcSight blev bragt til børsnotering og snart absorberet af Hewlett-Packard i 2010), vurderes begivenheden som forberedelse til enten et børsnoteret udbud eller et salg af virksomheden [16] . Olson flyttede til stillingen som strategisk direktør og bestyrelsesformand. I juli 2013 overtog firmaet det britiske firma Myrryx , grundlagt af Sean Owen , en af ​​hovedforfatterne af Hadoop-økosystemets skalerbare maskinlæringsramme Apache Mahout , Owen blev annonceret som "Director of Data Science " ( Engelsk direktør for datavidenskab ) [17] .  

I midten af ​​2013 modtog selskabet i alt 141 millioner dollars i fem investeringsrunder [16] , og i næste runde i marts 2014 rejste selskabet yderligere 160 millioner dollars [18] . I marts 2014, efter den sjette investeringsrunde, erhvervede Intel en 18% ejerandel i virksomheden for 740 millioner dollars, og værdiansatte dermed Clouderas forretning til cirka 4 milliarder dollars [19] ; samtidig opgav Intel udviklingen af ​​sin egen Hadoop-distribution skabt et år tidligere til fordel for at promovere løsninger fra Cloudera [18] . I juni 2014 købte virksomheden datakrypteringsteknologiudvikleren Gazzang [20] .

I april 2017 afholdt selskabet et børsnotering på New York Stock Exchange , som et resultat af hvilket det rejste $215 millioner [21] . I efteråret 2017 blev det New York-baserede maskinlæringsfirma Fast Forward Labs overtaget, handlen blev noteret som et svar på den tætte integration af Hortonworks med IBM, som lægger vægt på udviklingen af ​​kunstig intelligens-systemer inden for Watson -programmet , og opgav sin Hadoop-distribution til fordel for Hortonworks [22] .

I oktober 2018 blev en fusion med Hortonworks annonceret, mens strukturen beholdt Cloudera-navnet, notering på børsen og administrerende direktør, og Hortonworks aktionærer modtog 40% af aktierne i det kombinerede selskab [23] . Transaktionen blev gennemført den 3. januar 2019, på trods af den samlede værdiansættelse af de to virksomheder på tidspunktet for meddelelsen til $5,2 milliarder, efter dens afslutning beløb kapitaliseringen af ​​den kombinerede virksomhed sig til omkring $3 milliarder [24] . Overtagelsen fuldendte faktisk stadiet med konsolidering på markedet for kommercielle distributioner af Hadoop (af alle bemærkelsesværdige andre markedsdeltagere var det kun MapR tilbage med en årlig omsætning på omkring $175 millioner i 2018), hvilket flyttede fokus for konkurrencen til bredere segmenter - big data-værktøjer og analytiske platforme [25] .

I slutningen af ​​2020 købte virksomheden aktier tilbage fra Intel for $314 millioner ($426 millioner mindre end 2014-investeringen) [26] .

CDH

CDH ( Clouderas  distribution inklusive Apache Hadoop ) er en Apache Hadoop-distribution, der inkluderer en række relaterede programmer og biblioteker og Clouderas egne udviklingsværktøjer, frit distribueret og kommercielt understøttet for visse Linux-distributioner ( Red Hat Enterprise Linux , CentOS , Ubuntu , SuSE SLES , Debian ). Blandt Apache-softwareprojekterne relateret til Hadoop omfatter distributionen: Flume , HBase , Hive , Mahout , Oozie , Pig , Sqoop , Whirr , Zookeeper . Derudover inkluderer distributionen sit eget klyngestyringsundersystem Cloudera Manager , som inkluderer scripts til implementering af Hadoop-infrastrukturen både i lokale og cloud-miljøer ( Rackspace , Amazon EC2 , Softlayer ), samt hjælpeprogrammer og konfigurationer til understøtte byggeautomatisering ved hjælp af Apache Maven .

I begyndelsen af ​​2012 blev to versioner af CDH sendt, CDH2 (baseret på Hadoop 0.20.1) og CDH3 (baseret på Hadoop 0.20.2). CDH3-distributionen er inkluderet i leveringen af ​​Oracle Big Data-apparatet [27] hardware- og softwarekompleks , desuden leveres den første linje af kundesupport til Hadoop af Oracle Corporation , og Cloudera yder teknisk support til mere komplekse problemer. I midten af ​​2012 blev der udgivet en version af CDH4 baseret på Hadoop 2.0 (inklusive YARN -modulet ), tre af virksomhedens egne produkter er også inkluderet i CDH4 - Hue (browsergrænseflade til styring af en Hadoop-klynge), Impala og Søg (fuldtekst- og facetteret søgning i HDFS- og HBase- miljøer ). I 2014 udkom CDH5-versionen; CDH6-versionen, der blev udgivet i foråret 2018, er baseret på Hadoop 3.0 (hvoraf nøgleinnovationen var understøttelse af fejlkorrigerende kodning til HDFS, som kan reducere den fysiske størrelse af klynger markant) [28] .

Impala

Cloudera Impala  er en massivt parallel SQL -forespørgselsmotortil data lagret i HDFS og HBase , distribueret under Apache 2.0 -licensen. I modsætning til Hive , som oversætter forespørgsler i et SQL-lignende sprog (HiveQL) til MapReduce-job, der udføres i batch-tilstand, udfører Impala forespørgsler i et distribueret miljø interaktivt og distribuerer forespørgslen mellem behandlingsknuder baseret på sin egen mekanisme uden at ty til MapReduce.

Cloudera Manager

Cloudera Manager  er en specialiseret komponent, der giver dig mulighed for at automatisere oprettelsen og ændringen af ​​Hadoop-miljøer, spore og analysere effektiviteten af ​​behandlingsopgaver, opsætte advarsler om forekomsten af ​​visse hændelser relateret til driften af ​​den distribuerede behandlingsinfrastruktur. De årlige omkostninger til teknisk support er omkring $4.000 pr. klynge node [29] . Der er en gratis udgave til Cloudera Manager ( engelsk  gratis udgave ), som kun virker på klynger , der består af mindre end 50 noder og mangler en række funktioner, der er tilgængelige for kommercielle abonnenter (såsom ydeevneovervågning, konfigurationsversionering, Kerberos-understøttelse ).

Tematiske produkter

Efter Garnters forudsigelse i 2017 data management teknologi hype cyklus, at selve konceptet med en "Hadoop distribution" snart vil blive forældet, har virksomheden flyttet sit produktudbud til tematiske kits, der består af stort set de samme komponenter, som er samlet i CDH, men rettet mod visse specifikke opgaver. Så i 2018 dukkede produkter op under navnene Data Warehouse (montering til datavarehuse , med fokus på Impala), Operational DB (til operationelle databaser, omkring HBase , Kudu og Spark ), Data Engineering (til ETL og interaktive adgang til data), Data Science (til " data science "-opgaver ), Enterprise Data Hub (til dataplatforme på virksomhedsniveau - faktisk en komplet samling af Hadoop-distributionen plus et datakatalog baseret på dens egen SDX-komponent).

Siden 2018 har prispolitikken været dannet omkring tematiske produkter; Afhængigt af konfigurationen betaler abonnenter årligt fra $4.000 for at understøtte hver Data Engineering- og Data Science-produktnode til $10.000 for en Enterprise Data Hub-produktnode.

Noter

  1. Cloudera Inc. Morgenstjerne (7. september 2018). Arkiveret fra originalen den 7. september 2018.
  2. Malik, 2009 , jeg ser nogle interessante paralleller mellem Hadoop og Red Hat, som blev fremtrædende på bagsiden af ​​Red Hat Linux, en version af Linux optimeret til virksomhedsbrugere.
  3. Rao, 2011 , Cloudera hjælper med at distribuere Hadoop og leverer praktiske tjenester omkring teknologien, svarende til hvad Red Hat gør for Linux-rammeværket.
  4. Nairn, 2010 , Storagegiganten EMC er gået sammen med Cloudera, en specialist i databasesoftware, for at skabe teknologier til bedre at understøtte "big data" ... Start Cloudera bruger open source-softwarepakken Hadoop til at analysere meget store datasæt.
  5. Vance, 2011 , "Det vil være fyre som Jeff, der forstår, hvad de skal gøre med big data".
  6. Prickett-Morgan, 2009 , ...Christophe Bisciglia, der ledede partnerskabet mellem Google, IBM og National Science Foundation for at skabe Hadoop-gitter, som akademikere kan lege med; Amr Awadallah, en tidligere Yahoo-vicepræsident for teknik, der ledede dataopbevarings- og analyseindsatsen bag virksomhedens post-, søge-, finans- og nyhedstjenester; - Mike Olson, tidligere administrerende direktør for open source-databaseproducenten Sleepycat Software (nu ejet af Oracle); og Jeff Hammerbacher, tidligere for den sociale netværksgigant Facebook og lederen, der skabte Hive-projektet, som er et data warehousing-lag, der fungerer sammen med Hadoop, og som Facebook bruger til at analysere sine mange petabytes af information, der er gemt i sine brugerdata. lager.
  7. Businessweek, 2010 , Finansiering: $11 millioner fra Accel Partners, Greylock Partners og engleinvestorer, der inkluderer Gideon Yu og Caterina Fake.
  8. Prickett-Morgan, 2009 , ...Doug Cutting og Mike Cafarella som rådgivere samt Diane Green (grundlægger og tidligere CEO hos virtualiseringsspecialisten VMware) og Marten Mikos.
  9. Handy, Alex. Hadoop-skaberen går til Cloudera  (engelsk)  (downlink) . SD Times (9. oktober 2009). Hentet 25. december 2011. Arkiveret fra originalen 11. marts 2012.
  10. Businessweek, 2010 , Cloudera-medstifter Christophe Bisciglia var en af ​​Bloomberg BusinessWeek's bedste unge tekniske iværksættere i 2009.
  11. Businessweek, 2010 , Sværeste beslutning: Ændring af Clouderas forretningsmodel for at gøre den til en softwareleverandør.
  12. Worthen, Ben . Tidevandsforskydninger på webstart-ups  (engelsk) , N. Y. : The Wall Street Journal  (22. november 2011). Arkiveret fra originalen den 25. december 2011. Besøgt den 28. december 2011.  "Der er indgået flere store finansieringsaftaler siden da, herunder 85 millioner dollars til producenten af ​​menneskelige ressourcer-software Workday Inc., 81 millioner dollars til online fildelingssiden Box.net Inc., 50 millioner dollars til markedsføring virksomheden Marketo Inc. og 40 millioner dollars til datahåndteringsvirksomheden Cloudera Inc.
  13. 1 2 Darrow, Barb Cloudera fanger $65M mere for at øge international virksomhedsvækst  (  utilgængeligt link) . Gigaom (6. december 2012). — "Finansieringsrunden blev ledet af Accel Partners med hjælp fra Greylock Partners, Ignition Partners, In-Q-Tel og Meritech Capital Partners." Dato for adgang: 10. december 2012. Arkiveret fra originalen 17. december 2012.
  14. Rao, 2011 , Cloudera har netop annonceret $40 millioner i ny finansiering ledet af Ignition Partners, Greylock, Accel, Meritech Capital Partners og In-Q-Tel.
  15. Brust, Andrew Clouderas Impala bringer Hadoop til SQL og BI . Big Data-darling Clouderas Impala-produkt promoverer SQL til peer-niveau med  MapReduce . ZDNet (25. oktober 2012) .  "I stedet for at vinke "old school" database- og BI-professionelle (dvs. størstedelen af ​​virksomhedsudviklere og DBA'er) til at flytte til Hadoop, annoncerede den betaversionen af ​​et nyt produkt, Impala, der bringer Hadoop til dem." Hentet 1. januar 2014. Arkiveret fra originalen 2. januar 2014.
  16. 1 2 Prickett Morgan Cloudera vælger ny administrerende direktør for uundgåeligt IPO push eller opkøb . Tidligere administrerende direktør bliver formand og  chefstrateg . Registret (20. juni 2013) . Hentet 1. januar 2014. Arkiveret fra originalen 2. januar 2014.
  17. Clark, Jack Cloudera erhvervelse: Det er en Myrrix (cle) . Elefant fnyser elefantunge for maskinlæringsfærdigheder  (engelsk)  (downlink) . Registret (16. juli 2013) . Hentet 17. juli 2013. Arkiveret fra originalen 31. august 2013.
  18. 1 2 Harris, Dereck Intel forkaster sin Hadoop-distro og sætter millioner bag  Cloudera . Gigaom (27. marts 2014). Hentet 1. april 2014. Arkiveret fra originalen 30. marts 2014.
  19. Clark, Jack Rør ikke ved min kuffert! Intel er 740 mio. $ lettere efter Cloudera cash-shot . Kæmpe finansieringsaftale holder Oracle, IBM væk fra opkomlingens gule  elefant . Registret (31. marts 2014) . Hentet 1. april 2014. Arkiveret fra originalen 4. april 2014.
  20. Liam Tung. Cloudera køber store datakrypteringsudstyr Gazzang . Cloudera køber Gazzang for at tilbyde virksomhedskunder kryptering til hvilende data i Hadoop-klynger . ZDNet (15. juni 2014) . Hentet 23. september 2018. Arkiveret fra originalen 25. september 2019.
  21. Anita Balakrishnan. Cloudera-aktien lukker mere end 20 % højere på dag 1 . CNBC (28. april 2017). Hentet 23. september 2018. Arkiveret fra originalen 23. september 2018.
  22. Rebecca Hill. Cloudera bager AI biz, holder øje med IBM-kunder... og fortsætter med at rapportere driftstab . Nogen har bemærket Big Blues aftale med Hortonworks . Registret (8. september 2017) . Hentet 23. september 2018. Arkiveret fra originalen 23. september 2018.
  23. Kevin Kelleher. Cloudera, Hortonworks-aktier stiger, mens Big-Data-rivalerne annoncerer en fusion på $5,2 mia . Fortune (3. oktober 2018). Hentet 4. oktober 2018. Arkiveret fra originalen 4. oktober 2018.
  24. Rebecca Hill. Cloudera, Hortonworks smelter sammen til en amorf datahåndterings-blob efter aktionærernes afstemning . Nyt udseende firma vender opmærksomheden mod PR-offensiv . Registret (7. januar 2019) . Hentet 7. januar 2019. Arkiveret fra originalen 8. januar 2019.
  25. Andrew Brust. Cloudera og Hortonworks' fusion lukker; quo hvadis Big Data? . De to største Hadoop-distributionsleverandører er nu én. Hvad betyder det for Big Data-verdenen, for kunderne og for Apache Hadoop? . ZDNet (4. januar 2019) . Hentet 7. januar 2019. Arkiveret fra originalen 31. januar 2019.
  26. Max A. Cherney. Cloudera køber $314 millioner Intel-indsats tilbage. Her er, hvad det betyder for aktien . Barron's (23. december 2020). Hentet 25. december 2020. Arkiveret fra originalen 25. december 2020.
  27. Pricket Morgan, Timothy Oracle bestiger Clouderas elefant til big data ride  (eng.)  (link ikke tilgængeligt) . Registret (10. januar 2012). Dato for adgang: 13. januar 2012. Arkiveret fra originalen 6. september 2012.
  28. Tony Baer. Cloudera Enterprise 6 kommer på gaden . Hadoop 3.0 indtager en hovedrolle i den næste udgivelse af Clouderas platform . ZDNet (22. maj 2018) . Hentet 23. september 2018. Arkiveret fra originalen 27. november 2020.
  29. Pricket Morgan, Timothy. Cloudera bliver proaktiv med Hadoop-administration  (eng.)  (downlink) . Registret (8. september 2011). Hentet 15. april 2013. Arkiveret fra originalen 18. april 2013.

Links