DataMelt

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 14. februar 2019; checks kræver 13 redigeringer .
DataMelt
Udvikler S.V.Chekanov _
Skrevet i Java
Operativ system Unix , Linux , OS X , Microsoft Windows
Første udgave 2005 (oprindeligt navn JHepWork)
Hardware platform Java virtuel maskine
nyeste version 2.4 (februar 2019)
Licens Open source (LGPL, GPL og lignende)
Internet side jwork.org/dmelt/

DataMelt (eller forkortet DMelt ) er et gratis program til videnskabelig databehandling [1] [2] . DataMelt er et interaktivt miljø til databehandling, dataanalyse og visualisering og maskinlæring. DataMelt-programmet er designet til forskere, ingeniører og studerende. DataMelt er multiplatform, fordi det er skrevet i Java , så det kører på ethvert operativsystem, hvor en virtuel Java-maskine kan installeres. Programmet er designet til statistisk dataanalyse, kurvetilpasning, dataanalysealgoritmer, numeriske beregninger, maskinlæring og plotning i 2D og 3D. DataMelt bruger programmeringssprog på højt niveau som Jython , JRuby . Java kan også bruges til at kalde DataMelt numeriske biblioteker og grafikbiblioteker.

Oprettelseshistorie

DataMelt har sin oprindelse i partikelfysik , hvor datamining er den primære bekymring. Det blev oprettet som et jHepWork-projekt i 2005 og blev oprindeligt skrevet til dataanalyse for partikelfysikere på DESY - laboratoriet i Tyskland. Det blev senere forbedret ved Argonne National Laboratory for partikelfysisk forskning [3] ved hjælp af Java -softwarekonceptet til International Linear Collider-projektet , udviklet ved SLAC . Senere versioner af jHepWork er blevet modificeret til generel brug (videnskabsmænd, ingeniører, studerende til uddannelsesformål), siden International Linear Collider-projektet stoppede. I 2013 blev jHepWork omdøbt til DataMelt og blev et fællesskabsstøttet projekt til generelle formål. Den vigtigste referencekilde er bogen Analyzing Scientific Data Using Jython Scripting and Java. [4] som diskuterer dataanalyseteknikker ved hjælp af Java og Jython scripting . Dette blev senere også diskuteret i det tyske Java-magasin SPEKTRUM. [5] . Strengen "HEP" i navnet på projektet "jHepWork" er en forkortelse for "High Energy Physics". Men på grund af dens brede popularitet uden for dette område af fysik, er det blevet omdøbt til SCaViS ( 'S' videnskabeligt 'C' computermiljø og 'Vis' brugsmiljø). Dette projekt varede 3 år, før det blev omdøbt til DataMelt (eller DMelt for kort).

Understøttede platforme

DataMelt kører på Windows, Linux, Mac og Android platforme . Android-pakken hedder AWork.

Anmeldelser

DataMelt og dets tidligere versioner, SCaVis (2013-2015) og JHepWork (2005-2013), som stadig er tilgængelige i DataMelts arkivlager , diskuteres i disse artikler: [6] [7] [8] [9] Programmet blev sammenlignet med andre lignende programmer i disse ressourcer [10] [11] [12] .

DataMelt (2015-), er en ny udvikling af programmerne JHepWork og SCaVis. Disse ressourcer sammenligner DataMelt med andre populære statistiske og numeriske analysepakker. [13] [14] [15] [16] . Ifølge nyere anmeldelser af online artikler og blogs er DataMelt et af de populære dataanalyseprogrammer [17] [18] . .

Eksempelkode

Her er et eksempel på, hvordan man viser 2D-histogrammer ved at læse en CVS-fil, der er downloadet fra Verdensbankens hjemmeside .

fra jhplot.io.csv import * fra java.io import * fra jhplot import * d = {} læser = CSVReader ( FileReader ( "ny.gdp.pcap.cd_Indicator_en_csv_v2.csv" )); mens True : nextLine = læser . readNext () if nextLine is None : break xlen = len ( nextLine ) if xlen < 50 : continue d [ nextLine [ 0 ]] = float ( nextLine [ xlen - 2 ]) # key=country, value=DGP c1 = HChart ( "2013" , 800 , 400 ) #c1.setGTitle("2013 Bruttonationalprodukt pr. indbygger") c1 . synlig () c1 . setChartBar () c1 . setNameY ( "nuværende US$" ) c1 . setNameX ( "" ) c1 . setName ( "2013 Bruttonationalprodukt pr. indbygger" ) name1 = "Datakilde: World Development Indicators" sæt_værdi = lambda navn : c1 . værdibjælke ( d [ navn ], navn , navn1 ) set_value ( navn = "Rusland" ) set_value ( navn = "Polen" ) set_value ( navn = "Rumænien" ) set_value ( navn = "Bulgarien" ) set_value ( navn = "Hviderusland" ) set_value ( navn = "Ukraine" ) c1 . opdatering ()

Når dette script udføres, vises histogrammet i et separat vindue. Billedet kan gemmes i flere formater.

Her er et andet simpelt eksempel, der illustrerer, hvordan man udfylder et 2D-søjlediagram og viser det på et lærred. Scriptet opretter også en PDF - form . Dette script illustrerer, hvordan man limer og blander native Java-klasser (fra java.util-pakken) og DataMelt-klasser (fra jhplot-pakken) inde i et script skrevet ved hjælp af Python-syntaks.

fra java.util import Tilfældig fra jhplot import * c1 = HPlot3D ( "Canvas" ) # opret et interaktivt lærred c1 . setGTitle ( "Global titel" ) c1 . setNameX ( "X" ) c1 . sætnavnY ( "Y" ) c1 . synlig () c1 . setAutoRange () h1 = H2D ( "2D-histogram" , 25 , - 3,0 , 3,0 , 25 , - 3,0 , 3,0 ) random = Tilfældig () for i i området ( 200 ): h1 . fill ( rand . næsteGaussian (), rand . næste Gaussisk ()) c1 . tegne ( h1 ) c1 . eksport ( "jhplot3d.eps" ) # eksport til EPS vektorgrafik

Dette script kan køres enten med DataMelt IDE eller selvstændig Jython efter at have specificeret klassestien for DataMelt bibliotekerne.

Noter

  1. Numerisk beregning og statistisk dataanalyse på Java-platformen. S. V. Chekanov, bog. Springer, (2016) ISBN 978-3-319-28531-3 , 700 sider, [1] Arkiveret 14. april 2019 på Wayback Machine
  2. DataMelt: Gratis beregnings- og visualiseringsmiljø. Af Moaaz Aldesoky. medevel.com. [2] Arkiveret 9. august 2019 på Wayback Machine
  3. HEP-dataanalyse ved hjælp af jHepWork og Java, arXiv: 0809.0840v2, Preprint ANL-HEP-CP-08-53. CERN preprint, arXiv: 0809.0840v2 Arkiveret 19. november 2018 på Wayback Machine
  4. Analyse af videnskabelige data ved hjælp af Jython Scripting og Java. Bestil. S. V. Chekanov (SVChekanov), Springer-Verlag, ISBN 978-1-84996-286-5 , [3] Arkiveret 14. april 2019 på Wayback Machine
  5. ScaVis - Werkbank for dem, der udvikler applikationer til Java og Jython. Roe Klaus. JAVA SPEKTRUM. (på tysk), bind 5 (2013) 26-28 [4] Arkiveret 6. juni 2019 på Wayback Machine
  6. Dataanalyse og datamining ved hjælp af Java, Jython og jHepWork Blog. 2010. Oracle.com. [5] Arkiveret 6. juni 2019 på Wayback Machine
  7. SCaVis - Werkbank für technisch-wissenschaftliche Berechnungen und Visualisierungen mit Java und Jython. af Rohe Klaus. Java SPEKTRUM. (på tysk) bind 5 (2013) 26-28 [6] Arkiveret 6. juni 2019 på Wayback Machine
  8. HEP-dataanalyse ved hjælp af jHepWork og Java. Proceedings of the HERA-LHC workshops (2007-2008), DESY-CERN [7] Arkiveret 19. november 2018 på Wayback Machine
  9. Egnethedsanalyse af dataminingværktøjer og -metoder. [8] . S. Kovac, bachelorafhandling (på engelsk), jHepWork er gennemgået på side 39-42, Masaryk University.
  10. En anmeldelse: Sammenlignende undersøgelse af forskellig indsamling af datamineværktøjer. Af S. Sarumathi, N. Shanthi, S. Vidhya, M. Sharmila. International Journal of Computer, Control, Quantum and Information Engineering. 2014; 8(6). 7.
  11. En undersøgelse af værktøjer, teknikker og tendenser til Big Data Analytics. Af R.Shireesha et al. (2016) International Journal of Advance Computing Technique and Applications (IJACTA), ISSN : 2321-4546, Vol 4, Issue 1 [9] Arkiveret 31. marts 2019 på Wayback Machine
  12. Sammenligning af forskellige værktøjer til datamining. Af P.Kaur etc. IJERT ISSN: 2278-0181 Vol. 3 udgave 10 (2010) [10] Arkiveret 8. maj 2018 på Wayback Machine
  13. Sammenlignende analyse af informationsekstraktionsteknikker til datamining, af Amit Verma et al. Indian Journal of Science and Technology, bind 9, marts 2016 [11] Arkiveret 20. juli 2018 på Wayback Machine
  14. Kort gennemgang af uddannelsesapplikationer ved hjælp af datamining og maskinlæring, [12] Arkiveret 8. maj 2018 på Wayback Machine , af A. Berenice Urbina Nájera, Jordede la Calleja Mora, Redie ISSN 1607-4041. Revista Electronica de Investigación Educativa, 19(4), 84-96
  15. Analyse af data ved hjælp af Data Mining-værktøjet Orange. Maqsud S. Kukasvadiya et. al. [13] Arkiveret 9. maj 2018 på Wayback Machine (2017) IJEDR, bind 5, udgave 2, ISSN: 2321-9939
  16. Big Data - En undersøgelse af Big Data-teknologier. Af P.Dhavalchandra, M.Jignasu, R.Amit. International Journal of Science and Technology. Bind 2, s45-50 (2016) [14] Arkiveret 8. maj 2018 på Wayback Machine
  17. Popularitet for softwareprogrammer til datavidenskab ved hjælp af nylige anmeldelser, artikel (sep 2018), T.Smalzer (hentet i 2019), [15] Arkiveret 29. juli 2019 på Wayback Machine
  18. Evaluering og sammenligning af open source-softwarepakker til datamining og videnopdagelse, af Abdulrahman H. Altalhi, JM Luna, MA Vallejo, S. Ventura, Wires/Willey, DOI: 10.1002/widm.1204 (2017), [16] Arkiveret 31. maj 2019 på Wayback Machine

Links