Google Scholar | |
---|---|
URL | scholar.google.com |
Kommerciel | Ingen |
Site type | Søg efter videnskabelige publikationer |
Registrering | Valgfri |
Sprog) | 40 understøttede sprog |
Ejer | |
Begyndelse af arbejdet | 20. november 2004 |
Nuværende status | Arbejder |
Mediefiler på Wikimedia Commons |
Google Scholar er en gratis søgemaskine til forskningspublikationer, der blev lanceret i november 2004 på initiativ af Google -ingeniørerne Alex Verstak og Anurag Acharya . Ved hjælp af søgerobotter indekserer portalen metadata og udfører fuldtekstsøgninger i videnskabelig litteratur, herunder tidsskriftsartikler, fortryk , afhandlinger, bøger og tekniske rapporter. Brugere kan søge efter ønskede værker efter forfattere, nøgleord, tidsskriftstitel. Dybdesøgning giver dig mulighed for at rangere materialer efter udgivelse, dato og emneområde.
Google Academy leverer ikke data om det nøjagtige antal indekserede værker, men ifølge foreløbige skøn var der mindst 390 millioner i 2019. På trods af manglen på pålidelige data om størrelsen af databasen anses portalen for at være verdens verdens største akademiske søgemaskine med en rækkevidde på op til 90 % af alle engelsksprogede artikler.
Ideen om at skabe Google Academy tilhører Alex Verstak og Anurag Acharya . I begyndelsen af 2000'erne samarbejdede ingeniører om at forbedre Googles webbaserede indeksering af videnskabelige publikationer . Efterfølgende besluttede de at skabe en lignende søgemaskine til videnskabelig litteratur [1] [2] [3] . Ifølge Acharya udtænkte han et lignende projekt, mens han stadig studerede på Indian Institute of Technology . Så stødte ingeniøren først på problemet med betalingsvægge , på grund af hvilke videnskabelige artikler ikke faldt ind i søgeresultaterne, og videnskabsmænd måtte udføre dobbeltarbejde for at udarbejde en litteraturgennemgang [4] [5] [3] [6] . Workbench og Acharya søgte at lette adgangen til videnskabelig viden. Sloganet for Google Academy var sætningen " Stående på giganternes skuldre ", tilskrevet Bernard af Chartres og Isaac Newton [7] .
Den gratis søgemaskine blev lanceret i 2004 [5] [8] [5] . På tidspunktet for dets start indekserede Google Scholar artikler fra databaserne i tidsskrifterne Nature , Online Computer Library Center , Association for Computing Machinery og andre [9] . Samtidig manglede nogle grundlæggende funktioner, såsom filtrering af data efter dato [10] .
I 2006 tilføjede Google Scholar en ny funktion, der automatisk genererer og importerer bibliografiske citater af indekserede videnskabelige værker til kommercielle bibliografiske informationsstyringssystemer , herunder RefWorks , Reference Manager , EndNote og BibTeX [7] . Fra 2007 til 2011 var Google Scholar-linket på Googles startside [11] . I 2007 lancerede tjenesten efter aftale med forlagene et program til digitalisering af videnskabelige tidsskrifter. Dets hovedmål var at få adgang til metadata for publikationer for at lette processen med at søge, identificere og citere [7] . I 2010 annoncerede Google Scholar en ny funktion - "vækkeur" til visse anmodninger - brugere kunne modtage opdateringer om nye publikationer via mail [12] [13] . Siden 2012 har forskere været i stand til at oprette personlige profiler, selvstændigt tilføje og løbende opdatere information om alle publicerede værker. Samtidig beregner tjenesten automatisk individuelle scientometriske indikatorer [7] . Muligheden forbedrede ikke kun systemets søgemuligheder, men gjorde det også muligt at spore forskernes individuelle karrierer [1] . I 2013 koblede tjenesten funktionen af et personligt bibliotek til samlinger af videnskabelig litteratur og søgeresultater for bestemte forespørgsler i en personlig konto [7] .
I maj 2014 blev Google Scholar blokeret i Kina [14] . Mange kinesiske videnskabsmænd har udtalt, at nedlukningen vil påvirke udviklingen af videnskaben i landet negativt [15] [16] .
I 2021 introducerede portalen en ekstra funktion til at spore læsbarheden af de forskningsartikler, der falder ind under åben adgangsmandater, en politik for bevillingsgivere, der kræver, at forskere åbner deres arbejde gennem arkivering i arkiver [17] [18] .
Søgerobotter fra Google Academy scanner konstant nettet og tilføjer automatisk materialer, der er egnede i indhold og design til formatet af en videnskabelig artikel [1] . Nyhedsartikler, bøger, anmeldelser, kommercielle sider, blogs og Wikipedia -sider er således ikke genstand for indeksering [19] . Søgerobotter scanner materialer fra to hovedgrupper af kilder. Den første omfatter tidsskriftspublikationer, fortryk , afhandlinger og tekniske rapporter. Materialer identificeret på denne måde omfatter både fuldtekstdokumenter og citater med anmærkninger. Den anden gruppe omfatter materialer leveret af partnerorganisationer - tidsskriftsudgivere, videnskabelige selskaber, databaseudbydere og forskningsinstitutioner. De fleste af disse værker præsenteres i Google-stipendiet som citater med anmærkninger, da den fulde tekst stadig er skjult bag betalingsmure [20] [21] [22] [23] .
Søgerobotter har adgang til de største databaser af kommercielle videnskabelige og universitetsudgivere, herunder Association for Computing Machinery , Nature , Institute of Electrical and Electronics Engineers , Online Computer Library Center , Macmillan Publishers , John Wiley & Sons , University of Chicago Press [5 ] . Derudover scanner robotterne også deres digitale værter, herunder HighWire Press , Metapress , Ingenta , websteder for videnskabelige og statslige institutioner såsom American Physical Society , US National Institutes of Health , National Oceanic og Atmosfærisk administration og preprint-servere såsom arXiv.org , NASA Astrophysical Information System , RePEc og Citebase [24] [25] [22] . I 2007 gjorde Elsevier også sin ScienceDirect- database tilgængelig for Google [26] .
I nogle tilfælde indekserer Google Scholar også websteder. For at gøre dette skal portaler opfylde visse kriterier: offentliggøre hovedsagelig videnskabelige artikler (originale forskningsartikler, tekniske rapporter, tidsskriftspublikationer, konferenceartikler, afhandlinger og abstracts), være offentligt tilgængelige og også følge alle nødvendige tekniske anbefalinger [27] .
Systemet giver ikke data om det nøjagtige antal indekserede værker, så forskere er tvunget til at foretage deres egne vurderinger. Formodentlig var antallet af dokumenter føjet til Google Scholar i 2010 omkring 82 millioner, i 2014 - 99,3-109,3 millioner, i 2015 - 160-165 millioner og i 2019 - mere end 390 millioner [28] [29] . På trods af manglen på pålidelige data om størrelsen af databasen anses Google Scholar for at være verdens største akademiske søgemaskine med en dækningsgrad på op til 90 % af alle engelsksprogede artikler og 50 % af alle fuldtekstdokumenter [25 ] [30] [6] [31] [21] [32] .
Google Academy-crawlerne indekserer akademiske artikler fra alle sprog og discipliner [27] [21] . Det meste af det indekserede indhold lagres på udgiverens servere, hvor fuldtekstdokumenter er tilgængelige for betalt download [8] .
For at studere linkstrukturen af en artikel og bestemme dens "betydning", bruger Google Scholar algoritmer svarende til PageRank [ 33] . Crawlerne udtrækker bibliografiske data og citationsoplysninger, som derefter bruges til at rangere søgeresultater. Algoritmen vægter antallet af citater af et videnskabeligt arbejde størst – jo flere der er, jo højere vil artiklen blive vist i søgeresultaterne. Dette er forskelligt fra tilgangen til de fleste lignende videnskabelige databaser, der bruger omvendt kronologisk rækkefølge [23] . Kvaliteten af at citere værker spiller også en vigtig rolle; så hvis en publikation refereres af materialer med en høj vurdering, vokser dens placering i søgeresultaterne også [34] [35] . Søgemaskinen rangerer søgeresultaterne og graden af deres relevans for forespørgslen. Tilstedeværelsen af nøgleord i værkets titel har en væsentlig indflydelse på artiklens placering på listen. I dette tilfælde er hyppigheden af forekomsten af søgeord i den fulde tekst ligegyldig [36] [37] [27] . Artiklens alder spiller heller ikke en væsentlig rolle for algoritmen [38] .
Individuelle organisationer, herunder Elsevier, OpenScience, Mendeley, SAGE Publishing, råder forfattere til at følge principperne for søgemaskineoptimering og ændre deres arbejde på en sådan måde, at det er lettere for akademiske søgemaskiner at gennemgå og indeksere det [39] . Forfattere rådes også til selvstændigt at tilpasse deres tekster til Google Scholar-standarder, så så mange mennesker som muligt kan få adgang til dem [40] [41] [42] .
Citationssporingsfunktionen dukkede op i Google Scholar i december 2004, næsten umiddelbart efter lanceringen af platformen [43] [44] . Forskere er ofte afhængige af en citationsscore, impact factor , for at holde styr på de mest indflydelsesrige artikler om et bestemt emne [22] [23] . Funktionen gjorde det muligt for Google Scholar at konkurrere med betalte søgemaskiner fra traditionelle udgivere. Før dette tilbød kun Web of Science- portalen fra Thomson Scientific [23] [22] [21] [45] denne mulighed .
Google Scholar beregner og viser automatisk tre forfattercitationsmetrics [25] :
Google Scholar-grænsefladen ligner Googles startside. Brugere kan søge efter forfattere, nøgleord, tidsskriftstitler. Avanceret søgning giver dig mulighed for at filtrere resultaterne efter specifikke tidsskrifter, dato og emneområde [46] [47] . Efter at have indtastet en anmodning, returnerer portalen op til 1000 resultater, som hver indeholder bibliografiske data (titel, forfatternes navne, publikationskilde) samt links til et abstrakt eller en fuld version af værket, hvis det er i offentligt domæne . Brugere kan se citater til publikationen fra andre kilder, links til onlineressourcer, hvor materialet præsenteres, eller til biblioteker, der har en fysisk kopi af værket. I dette tilfælde vises objektets digitale identifikator ikke. Google Scholar giver brugere adgang til flere versioner af det samme dokument [46] [21] .
Mit bibliotek-funktionen giver dig mulighed for at "gemme" personlige samlinger af artikler, der kan organiseres ved hjælp af tags. Brugere kan generere bibliografiske referencer til enhver videnskabelig artikel. Systemet genererer referencer i alle de mest almindeligt anvendte internationale bibliografiske standarder, såsom MLA-stil Modern Language Association , APA -stil , Turabian (Chicago) -stil [ , Harvard-stil , American Chemical Society-stil , stil AIP American Institute of Physics, IEEE stil , Vancouver stil og andre [7] . Portalen giver dig også mulighed for at importere citater til programmer som EndNote, BibTeX, RefMan eller RefWorks. Brugere kan oprette og redigere forfatterprofiler, herunder angive deres institutionelle tilhørsforhold, fem områder af videnskabelig interesse og tilføje publikationer. Det er dog kun profiler med verificerede akademiske e-mailadresser, der vises i søgeresultaterne. Det er også muligt at abonnere på andre forfatteres opdateringer for at modtage e-mail-meddelelser om nye artikler eller citater [25] .
Moderne videnskabsmænd kalder fremkomsten af Google Academy en revolution inden for videnskabelig litteratursøgning. Ifølge forskellige kilder bruges portalen af 43,7 % til 88 % af forskerne. Google Scholar reducerer chancen for utilsigtet duplikering af forskning, hvilket især er vigtigt for områder af videnskab med høje omkostninger ved eksperimenter, såsom fysik og medicin [4] [47] [48] [49] [50] [28] .
Udbredelsen af Google Scholar har øget betydningen af "ikke-prestigefyldte" videnskabelige tidsskrifter og gamle artikler. Dette kan forklares med indflydelsen fra rangeringsalgoritmen, som prioriterer arbejdets relevans i forhold til brugerens anmodning, og ikke elitismen i det tidsskrift, hvori de udgives. Gamle papirer har flere fordele, fordi systemet fokuserer på papirer med flere citater [50] [51] [52] .
Funktionaliteten af Google Academy bidrog til populariseringen af brugen af scientometriske indikatorer til at evaluere forskernes arbejde: mange arbejdsgivere begyndte at stole på dem, når de vurderede kandidater [48] . Søgemaskinen har også haft indflydelse på open access -bevægelsen . Gennem samarbejde med førende udgivere skubbede Google Scholar kommercielle udgivere til at digitalisere abstracts af papirer med betalingsmur – før det var resuméer ikke tilgængelige for visning, og brugere kunne kun se dem ved at få fuld adgang til papiret [4] .
Mange forskere advarer mod at bruge Google Scholar som den eneste kilde til gennemgang af den videnskabelige litteratur. Årsagerne til dette er fejlene i rangeringsalgoritmen, som nogle gange viser unøjagtige resultater, katalogiseringsfejl, tilskrivning af fejlagtige citater eller medtagelse af ikke-strengt akademisk materiale. Dækningen af indekserede værker er også begrænset til adgang til visse organisationer og underlagt aftale med udgivere [28] . Google Scholarship-søgning er hverken reproducerbar eller gennemsigtig - gentagne forespørgsler returnerer ofte forskellige resultater [53] [54] [31] . Derudover er indekserede tidsskrifter ikke genstand for manuel verifikation, hvilket fører til indtastning i databasen over rovtidsskrifter [55] . Også en undersøgelse fra 2021 fandt en sproglig skævhed i Google Academys algoritme - dokumenter udgivet på ikke-engelske sprog er systematisk henvist til positioner, der gør dem næsten usynlige [56] .
Udbredelsen af Google Scholar har bidraget til Matthew-effekten - et relativt lille antal publikationer tiltrækker et uforholdsmæssigt voksende antal citater, mens det meste andet arbejde stort set går ubemærket hen [57] . Dette skyldes, at forskere fortsætter med at udvælge artikler fra de bedste resultater, automatisk antage deres gyldighed (for eksempel baseret på et stort antal tidligere citater), og også citere dem i deres artikler [58] [59] . Google Academy-rangeringsalgoritmen har dog en række sårbarheder. Forskere har eksperimenteret med at manipulere deres egne individuelle citatrangeringer ved at tilføje usynlige ord til forsiden af en af deres konferenceartikler og ændre indholdet og bibliografien i nogle af deres allerede offentliggjorte artikler. Dette resulterede i en stigning i citater og forbedrede individuelle scores [60] [61] . Derudover vil promoveringen af individuelle citationsscores af portalen potentielt føre til en forringelse af kvaliteten af videnskabelige artikler, da forskere er mere optaget af individuelle citationsscores end indhold [62] .