Citationsanalyse

Citationsanalyse er studiet af hyppigheden, mønstrene og tidsplanerne for citater i dokumenter. Den bruger tilbudsmønsteret, linker fra et dokument til et andet dokument, til at opdage dokumenternes egenskaber. Et typisk mål er at identificere de vigtigste dokumenter i en samling. Et klassisk eksempel er citering mellem akademiske artikler og bøger. [1] [2] Retslige afgørelser i det angelsaksiske retssystem henviser for at bekræfte deres afgørelser til afgørelser truffet i tidligere sager, så analysen af citat i en juridisk sammenhæng er vigtig. Et andet eksempel er patenter, der indeholder tidligere opfindelser, tidligere citerede patenter, der vedrører det aktuelle krav.

Dokumenter kan forbindes med mange andre funktioner udover citater, såsom forfattere, forlag, tidsskrifter samt deres faktiske tekster. Den generelle analyse af samlinger af dokumenter kaldes bibliometri , og citationsanalyse er en central del af denne retning. For eksempel er bibliografisk kobling og deling associerede metrics baseret på citationsanalyse (delte citater eller delte citater). Citater i en samling af artikler kan også præsenteres i form af følgende citationsgrafer, som bemærket af Derek de Solla Price i papiret "Networks of Scientific Papers" fra 1965. [3] Det betyder, at citationsanalyse trækker på aspekter af social netværksanalyse og netværksvidenskab.

Et tidligt eksempel på automatisk citationsindeksering var CiteSeer , som blev brugt til citater i videnskabelige rapporter, og Google Scholar er et eksempel på et moderne system, der omfatter mere end blot akademiske bøger og artikler og afspejler en bredere vifte af informationskilder. I dag har automatiseret citationsindeksering [4] ændret karakteren af citationsanalyseforskning, hvilket gør det muligt at analysere millioner af citater med henblik på storskalamodeller og videnopdagelse. Citationsanalyseværktøjer kan bruges af forskere til at beregne forskellige grader af påvirkning baseret på citationsindeksdata . [5] [6] [7] De har ansøgninger, der spænder fra at identificere ekspertdommere til at gennemgå dokumenter og bevillingsforslag, til at levere gennemsigtige data til støtte for beslutninger om akademisk merit, embedsperiode og beslutningstagning. Denne konkurrence om begrænsede ressourcer kan føre til etisk tvivlsom adfærd for flere citater. [8] [9]

Praksisen med naivt at bruge citationsanalyse til at sammenligne virkningen af forskellige videnskabelige artikler uden at tage højde for andre faktorer, der kan påvirke citationsmønstre, er blevet stærkt kritiseret. [10] Blandt kritikpunkterne fokuserer man konsekvent på "industriens uafhængighed", nemlig det faktum, at citeringspraksis inden for et videnskabsfelt adskiller sig fra praksis i et andet og endda mellem forskningsgrene inden for en disciplin. [elleve]

Oversigt

Mens citationsindekser oprindeligt blev udviklet til informationssøgning , bliver de i stigende grad brugt til bibliometriske og andre undersøgelser, der involverer forskningsevaluering. Citationsdata er også grundlaget for et populært tidsskrifts indflydelseskvotient .

Der er en stor mængde litteratur om citationsanalyse, nogle gange omtalt som scientometrics , et udtryk opfundet af Vasily Nalimov , eller mere specifikt bibliometri . Industrien begyndte at blomstre med fremkomsten af Science Citation Index, som dækker litteratur udgivet siden 1900. Branchens førende tidsskrifter er Scientometrics , Informatics og Journal of the Association for Information Science and Technology. Sidstnævnte organiserer også en elektronisk postliste kaldet Sigmetrica hos ATIT. [12] Denne metode genoplives gennem udbredt databaseadoption, Web Science og Scopus-abonnementer på mange universiteter og offentlige gratis citationsværktøjer såsom CiteBase, CiteSeerX , Google Scholar og det tidligere Windows Live Academic-program (nu tilgængeligt med yderligere funktioner som f.eks. ligesom Microsoft Academic Search). Citationsanalyseforskningsmetoder omfatter kvalitative, kvantitative og beregningsmæssige tilgange. Hovedfokus for sådanne scientometriske undersøgelser har været benchmarking af ydeevne, institutionelle forskningsrangeringer, klassificering af tidsskrifter [13] vedrørende fastsættelse af præstationsfaktorer og ejerskabsstandarder, [14] evaluering af virkningen af top videnskabelige artikler, [15] sporing af en videnskabs bane eller teknologiindustrien [16] , og udvikling af profiler for førende forfattere og institutioner med hensyn til forskningsresultater. [17]

Juridisk citationsanalyse er en citationsanalyseteknik til at analysere juridiske dokumenter, der gør det lettere at forstå relaterede normative dokumenter ved at undersøge citater, der knytter en bestemmelse til andre bestemmelser i samme dokument eller mellem forskellige dokumenter. Juridisk citationsanalyse bruger en citationsgraf taget fra et regulatorisk dokument, der kan supplere elektronisk opdagelse, en proces, der påvirker teknologisk innovation inden for big data- analyse . [18] [19] [20] [21]

Historie

I et papir fra 1965 beskrev Derek de Solla Price SCI's iboende bindende egenskab som "et netværk af videnskabelige artikler". Forbindelserne mellem citater og citerede artikler blev dynamiske, da SCI begyndte at udgive online. Social Science Citation Index var en af de første databaser installeret i Dialog-systemet [22] i 1972. Med fremkomsten af cd'er er referencer blevet endnu enklere, hvilket gør det muligt at bruge bibliografiske links til at finde relaterede optegnelser. I 1973 udgav Henry Small sit klassiske værk om co-citationsanalyse, som blev et selvorganiseret klassifikationssystem, der førte til eksperimenter med dokumentklynger og til sidst til Atlas of Science, som senere blev til Research Reviews.

Den iboende topologiske og grafiske karakter af det verdensomspændende citationsweb, der er iboende i videnskabelig litteratur, blev beskrevet af Ralph Garner (Drexel University) i 1965. [23]

Brugen af citationsscore i rangerede tidsskrifter var en almindelig praksis i første halvdel af det 19. århundrede, men den systematiske løbende måling af disse scores for videnskabelige tidsskrifter blev initieret af Eugene Garfield ved Institute for Scientific Information, som også blev den primære kilde for at bruge disse scores til at bedømme forfattere og artikler. I et skelsættende papir fra 1965 viste han og Irving Sher forholdet mellem hyppighed og citeringsvækst, hvilket demonstrerede, at nobelprisvindere offentliggjorde deres artikler fem gange i gennemsnit, mens deres artikler blev citeret 30-50 gange i gennemsnit. Garfield rapporterede om dette fænomen i en lang række essays om Nobelprisen og andre priser. Den sædvanlige endelige score er kendt som indflydelsesratio , antallet af citater i tidsskriftet i de foregående to år divideret med antallet af artikler publiceret i disse år. Det er meget udbredt til både almindelige og specielle formål, især dets brug til evaluering af forfattere og dokumenter er ret kontroversielt .

I en tidlig undersøgelse fra 1964, der brugte citationsanalyse til at skrive DNA- historie, demonstrerede Garfield og Sher potentialet til at producere historiografi , topologiske kort over store trin i videnskabelige emners historie. Dette arbejde blev senere automatiseret af E. Garfield, A. I. Pudovkin fra Institute of Marine Biology ved National Academy of Sciences og V. S. Istomin fra Center for Teaching, Learning and Technology, Washington State University og førte til oprettelsen af Histcite-softwaren [ 24] i 2002.

Automatisk citationsindeksering blev introduceret i 1998 af Lee Giles, Steve Lawrence og Kurt Bollacker og tillod automatisk algoritmisk sletning og gruppering af citater for ethvert digitalt akademisk og videnskabeligt dokument. Hvor forudgående tilbagetrækning af citat var en manuel proces, kan citationsrater nu øges og beregnes for enhver akademisk gren eller mødested, ikke kun dem, der er tildelt af organisationer som ISI. Dette førte til skabelsen af nye systemer til indeksering af offentlige og automatiske citater, hvoraf det første var CiteSeer (nu CiteSeerX , som snart blev arvet af Cora-systemet, som primært fokuserede på datalogi og datalogi . Senere blev store akademiske domænenavnesystemer som f.eks. som Google Scholar og Microsoft Academic. Denne offline citationsindeksering er endnu ikke blevet perfektioneret i citationsekstraktion eller citationsclustering med en fejlrate, der anslås til at være et sted omkring 10 %, selvom omhyggelig statistisk stikprøve endnu ikke er blevet foretaget.Forfattere som Ann Arbor , Milton Keynes og Walton Hall har produceret en enorm mængde akademiske resultater.25 SCI hævder at skabe automatisk citationsindeksering gennem rent programmatiske metoder.Selv ældre poster har samme fejlmargin.

Citationsanalyse for juridiske dokumenter

Citationsanalyse for juridiske dokumenter er en tilgang, der hjælper med at forstå og analysere relaterede normative dokumenter ved at undersøge citater, der knytter en bestemmelse til andre bestemmelser i samme dokument og mellem forskellige dokumenter. Citationsanalyse bruger en citationsgraf, der er afledt af et normativt dokument, der kunne supplere elektronisk opdagelse, en proces, der driver teknologisk innovation inden for big data-analyse. [26]

Kritik

Elektroniske publikationer . På grund af den hidtil usete stigning i tilgængeligheden af elektroniske ressourcer, er et af de brændende spørgsmål, der nu undersøges, blevet spørgsmålet "hvor ofte citeres elektroniske ressourcer på internettet i min branche?". [27] For eksempel er det blevet hævdet, at onlineadgang til datalogisk litteratur fører til højere citeringsrater, [28] dog kan humanistiske artikler lide, hvis de ikke findes på tryk.

Selvciterende . Forfatteres praksis til at "lege" med systemet ved at akkumulere citater, ved at overcitere sig selv [29] er blevet kritiseret meget . Samtidig fandt man for eksempel ud af, at mænd citerer sig selv oftere end kvinder.

Se også

Noter

↑ Rubin, Richard. Fundamenter for biblioteks- og informationsvidenskab (engelsk) . — 3. - New York: Neal-Schuman Publishers, 2010. - ISBN 978-1-55570-690-6 .
↑ Garfield, E. Citation Indexing - Dens teori og anvendelse i videnskab, teknologi og humaniora Philadelphia: ISI Press, 1983. . Hentet 29. august 2018. Arkiveret fra originalen 9. marts 2018. (ubestemt)
↑ Derek J. de Solla Price. Networks of Scientific Papers (engelsk) // Science : journal. - 1965. - 30. juli ( bd. 149 , nr. 3683 ). - S. 510-515 . - doi : 10.1126/science.149.3683.510 . - . — PMID 14325149 .
↑ Giles, C. Lee; Bollacker, Kurt D. & Lawrence, Steve (1998), CiteSeer: et automatisk citationsindekseringssystem. , Digitale biblioteker 98 : The Third ACM Conference on Digital Libraries, 23.-26. juni 1998, Pittsburgh, PA (New York: Association for Computing Machinery): 89-98, ISBN 0-89791-965-3 , doi : 10.1145/ 276675.276685 , < http://doi.acm.org/10.1145/276675.276685 > . Hentet 7. juli 2011.
↑ Eksempler inkluderer abonnementsbaserede værktøjer baseret på proprietære data, såsom Web of Science og Scopus , og gratis værktøjer baseret på åbne data, såsom Scholarometer Archived 18 April 2022 at the Wayback Machine af Filippo Menczer og hans team.
↑ Kaur, Jasleen. Scholarometer: A Social Framework for Analyzing Impact across Disciplines (engelsk) // PLoS ONE : journal. - 2012. - Bd. 7 , nr. 9 . - doi : 10.1371/journal.pone.0043235 . - . — PMID 22984414 .
↑ Hoang, D.; Kaur, J. & Menczer, F. (2010), Crowdsourcing Scholarly Data , Proceedings of the WebSci10: Extending the Frontiers of Society On-Line, 26.-27. april 2010, Raleigh, NC: USA , < http:/ /journal .webscience.org/321/ > . Hentet 29. august 2018. Arkiveret 17. april 2015 på Wayback Machine
↑ Anderson, MS van. De perverse virkninger af konkurrence på videnskabsmænds arbejde og forhold // Videnskab og ingeniøretik : journal. - 2007. - Bd. 4 , nr. 13 . - S. 437-461 . - doi : 10.1007/s11948-007-9042-5 .
↑ Wesel, M. van. Evaluering efter citat: Tendenser i udgivelsesadfærd, evalueringskriterier og stræben efter publikationer med stor effekt // Science and Engineering Ethics : journal. - 2016. - Bd. 22 , nr. 1 . - S. 199-225 . - doi : 10.1007/s11948-015-9638-0 . — PMID 25742806 .
↑ Hvad måler citattællinger? En gennemgang af undersøgelser om citeringsadfærd // Journal of Documentation : journal. - 2008. - Bd. 64 , nr. 1 . - S. 45-80 . - doi : 10.1108/00220410810844150 .
↑ Anauati, Maria Victoria og Galiani, Sebastian og Gálvez, Ramiro H., Quantifying the Life Cycle of Scholarly Articles Across Fields of Economic Research (11. november 2014). Tilgængelig på SSRN: http://ssrn.com/abstract=2523078 Arkiveret 17. november 2014.
↑ The American Society for Information Science & Technology (utilgængeligt link) . Informationssamfundet for informationsalderen . Hentet 21. maj 2006. Arkiveret fra originalen 3. oktober 2019. (ubestemt)
↑ Lowry, Paul Benjamin; Moody, Gregory D.; Gaskin, James; Galletta, Dennis F.; Humpherys, Sean; Barlow, Jordan B.; og Wilson, David W. (2013). " Evaluering af tidsskriftkvalitet og Association for Information Systems (AIS) Senior Scholars' journalkurv via bibliometriske mål: Tilføjer eksperttidsskriftsvurderinger værdi? Arkiveret 21. marts 2019 på Wayback Machine , MIS Quarterly (MISQ), vol. 37(4) , 993-1012. YouTube kan også se videofortælling om dette papir på: https://www.youtube.com/watch?v=LZQIDkA-ke0&feature=youtu.be Arkiveret 21. marts 2019 på Wayback Machine .
↑ Dean, Douglas L; Lowry, Paul Benjamin; og Humpherys, Sean (2011). Profilering af forskningsproduktiviteten af fastansat informationssystemfakultet ved amerikanske institutioner Arkiveret 9. januar 2016 på Wayback Machine , MIS Quarterly (MISQ), vol . 35(1), s. 1-15 ( ISSN 0276-7783 ).
↑ Karuga, Gilbert G.; Lowry, Paul Benjamin; og Richardson, Vernon J. (2007). Vurdering af virkningen af førende informationssystemforskning over tid, Communications of the Association for Information Systems, vol. 19(7), s. 115-131 (http://aisel.aisnet.org/cais/vol19/iss1/7) Arkiveret 25. januar 2016 på Wayback Machine
↑ Liu, John S. En integreret tilgang til hovedvejsanalyse: Udvikling af Hirsch-indekset som eksempel // Journal of the American Society for Information Science and Technology : journal. - 2012. - 1. marts ( bd. 63 , nr. 3 ). - S. 528-542 . — ISSN 1532-2890 . - doi : 10.1002/asi.21692 .
↑ Lowry, Paul Benjamin; Karuga, Gilbert G.; og Richardson, Vernon J. (2007). Vurdering af førende institutioner, fakulteter og artikler i førende informationssystemer forskningstidsskrifter, Communications of the Association for Information Systems, vol. 20(16), s. 142-203 (http://aisel.aisnet.org/cais/vol20/iss1/16). Arkiveret 9. januar 2016 på Wayback Machine
↑ http://ieeexplore.ieee.org/search/wrapper.jsp?arnumber=5070630&tag=1 (downlink pr. 29.08.2018 [1517 dage])
↑ Mohammad Hamdaqa og A. Hamou-Lhadj, "Citationsanalyse: En tilgang til at lette forståelsen og analysen af regulatoriske overholdelsesdokumenter", I Proc. af den 6. internationale konference om informationsteknologi, Las Vegas, USA
↑ E-Discovery Special Report: The Rising Tide of Nonlinear Review . Hudson Global . Hentet 1. juli 2012. Arkiveret fra originalen 3. juli 2012. (ubestemt) af Cat Casey og Alejandra Perez
↑ Hvad teknologistøttet elektronisk opdagelse lærer os om menneskers rolle i teknologi - Re-humanisering af teknologistøttet gennemgang . Forbes . Hentet 1. juli 2012. Arkiveret fra originalen 18. juni 2012. (ubestemt)
↑ Dialog, A Thomson Business . "Dialog opfundet online informationstjenester" . Hentet 21. maj 2006. Arkiveret fra originalen 13. januar 2004. (ubestemt)
↑ Arkiveret kopi . Hentet 29. august 2018. Arkiveret fra originalen 9. september 2017. (ubestemt)
↑ Eugene Garfield Algorithmic Citation-Linked Historiography—Mapping the Literature of Science . Præsenterede ASIS&T 2002: Information, forbindelser og fællesskab. 65. årsmøde i ASIST i Philadelphia, PA. 18.-21. november 2002 (2002). Hentet 21. maj 2006. Arkiveret fra originalen 20. oktober 2016. (ubestemt)
↑ Postellon DC Hall og Keynes slutter sig til Arbor i citationsindeksene // Nature : journal. - 2008. - Marts ( bd. 452 , nr. 7185 ). - doi : 10.1038/452282b . — . — PMID 18354457 .
↑ Hamdaqa, M.; En Hamou-Lhadj. Citationsanalyse: En tilgang til at lette forståelsen og analysen af regulatoriske overholdelsesdokumenter . - Las Vegas, NV: Institute of Electrical and Electronics Engineers , 2009. - S. 278-283. - ISBN 978-1-4244-3770-2 . - doi : 10.1109/ITNG.2009.161 .
↑ Zhao, Lisa. "Hvordan bibliotekar brugte e-ressourcer - en analyse af citater i CCQ." Cataloging & Classification Quarterly 42(1) (2006): 117-131.
↑ Lawrence, Steve. Gratis online tilgængelighed øger et papirs indvirkning markant. Nature bind 411 (nummer 6837) (2001): 521. Også online på http://citeseer.ist.psu.edu/online-nature01/ Arkiveret 9. juni 2010 på Wayback Machine
↑ Gálvez RH Vurdering af forfatterens selvcitering som en mekanisme for spredning af relevant viden // Scientometrics : journal. - 2017. - Marts ( bd. 111 , nr. 3 ). - S. 1801 . - doi : 10.1007/s11192-017-2330-1 .