DataMelt | |
---|---|
Udvikler | S.V.Chekanov _ |
Skrevet i | Java |
Operativ system | Unix , Linux , OS X , Microsoft Windows |
Første udgave | 2005 (oprindeligt navn JHepWork) |
Hardware platform | Java virtuel maskine |
nyeste version | 2.4 (februar 2019) |
Licens | Open source (LGPL, GPL og lignende) |
Internet side | jwork.org/dmelt/ |
DataMelt (eller forkortet DMelt ) er et gratis program til videnskabelig databehandling [1] [2] . DataMelt er et interaktivt miljø til databehandling, dataanalyse og visualisering og maskinlæring. DataMelt-programmet er designet til forskere, ingeniører og studerende. DataMelt er multiplatform, fordi det er skrevet i Java , så det kører på ethvert operativsystem, hvor en virtuel Java-maskine kan installeres. Programmet er designet til statistisk dataanalyse, kurvetilpasning, dataanalysealgoritmer, numeriske beregninger, maskinlæring og plotning i 2D og 3D. DataMelt bruger programmeringssprog på højt niveau som Jython , JRuby . Java kan også bruges til at kalde DataMelt numeriske biblioteker og grafikbiblioteker.
DataMelt har sin oprindelse i partikelfysik , hvor datamining er den primære bekymring. Det blev oprettet som et jHepWork-projekt i 2005 og blev oprindeligt skrevet til dataanalyse for partikelfysikere på DESY - laboratoriet i Tyskland. Det blev senere forbedret ved Argonne National Laboratory for partikelfysisk forskning [3] ved hjælp af Java -softwarekonceptet til International Linear Collider-projektet , udviklet ved SLAC . Senere versioner af jHepWork er blevet modificeret til generel brug (videnskabsmænd, ingeniører, studerende til uddannelsesformål), siden International Linear Collider-projektet stoppede. I 2013 blev jHepWork omdøbt til DataMelt og blev et fællesskabsstøttet projekt til generelle formål. Den vigtigste referencekilde er bogen Analyzing Scientific Data Using Jython Scripting and Java. [4] som diskuterer dataanalyseteknikker ved hjælp af Java og Jython scripting . Dette blev senere også diskuteret i det tyske Java-magasin SPEKTRUM. [5] . Strengen "HEP" i navnet på projektet "jHepWork" er en forkortelse for "High Energy Physics". Men på grund af dens brede popularitet uden for dette område af fysik, er det blevet omdøbt til SCaViS ( 'S' videnskabeligt 'C' computermiljø og 'Vis' brugsmiljø). Dette projekt varede 3 år, før det blev omdøbt til DataMelt (eller DMelt for kort).
DataMelt kører på Windows, Linux, Mac og Android platforme . Android-pakken hedder AWork.
DataMelt og dets tidligere versioner, SCaVis (2013-2015) og JHepWork (2005-2013), som stadig er tilgængelige i DataMelts arkivlager , diskuteres i disse artikler: [6] [7] [8] [9] Programmet blev sammenlignet med andre lignende programmer i disse ressourcer [10] [11] [12] .
DataMelt (2015-), er en ny udvikling af programmerne JHepWork og SCaVis. Disse ressourcer sammenligner DataMelt med andre populære statistiske og numeriske analysepakker. [13] [14] [15] [16] . Ifølge nyere anmeldelser af online artikler og blogs er DataMelt et af de populære dataanalyseprogrammer [17] [18] . .
Her er et eksempel på, hvordan man viser 2D-histogrammer ved at læse en CVS-fil, der er downloadet fra Verdensbankens hjemmeside .
fra jhplot.io.csv import * fra java.io import * fra jhplot import * d = {} læser = CSVReader ( FileReader ( "ny.gdp.pcap.cd_Indicator_en_csv_v2.csv" )); mens True : nextLine = læser . readNext () if nextLine is None : break xlen = len ( nextLine ) if xlen < 50 : continue d [ nextLine [ 0 ]] = float ( nextLine [ xlen - 2 ]) # key=country, value=DGP c1 = HChart ( "2013" , 800 , 400 ) #c1.setGTitle("2013 Bruttonationalprodukt pr. indbygger") c1 . synlig () c1 . setChartBar () c1 . setNameY ( "nuværende US$" ) c1 . setNameX ( "" ) c1 . setName ( "2013 Bruttonationalprodukt pr. indbygger" ) name1 = "Datakilde: World Development Indicators" sæt_værdi = lambda navn : c1 . værdibjælke ( d [ navn ], navn , navn1 ) set_value ( navn = "Rusland" ) set_value ( navn = "Polen" ) set_value ( navn = "Rumænien" ) set_value ( navn = "Bulgarien" ) set_value ( navn = "Hviderusland" ) set_value ( navn = "Ukraine" ) c1 . opdatering ()Når dette script udføres, vises histogrammet i et separat vindue. Billedet kan gemmes i flere formater.
Her er et andet simpelt eksempel, der illustrerer, hvordan man udfylder et 2D-søjlediagram og viser det på et lærred. Scriptet opretter også en PDF - form . Dette script illustrerer, hvordan man limer og blander native Java-klasser (fra java.util-pakken) og DataMelt-klasser (fra jhplot-pakken) inde i et script skrevet ved hjælp af Python-syntaks.
fra java.util import Tilfældig fra jhplot import * c1 = HPlot3D ( "Canvas" ) # opret et interaktivt lærred c1 . setGTitle ( "Global titel" ) c1 . setNameX ( "X" ) c1 . sætnavnY ( "Y" ) c1 . synlig () c1 . setAutoRange () h1 = H2D ( "2D-histogram" , 25 , - 3,0 , 3,0 , 25 , - 3,0 , 3,0 ) random = Tilfældig () for i i området ( 200 ): h1 . fill ( rand . næsteGaussian (), rand . næste Gaussisk ()) c1 . tegne ( h1 ) c1 . eksport ( "jhplot3d.eps" ) # eksport til EPS vektorgrafikDette script kan køres enten med DataMelt IDE eller selvstændig Jython efter at have specificeret klassestien for DataMelt bibliotekerne.
Matematik software | |
---|---|
Symbolske beregninger | |
Numeriske beregninger |