Netværksvidenskab er et videnskabeligt område, der studerer komplekse netværk , såsom kommunikation , computer , biologiske , kognitive og semantiske netværk , samt sociale netværk , og overvejer de forskellige elementer eller deltagere i processen, repræsenteret af noder (eller knudepunkter ), og forbindelserne mellem elementer eller deltagere, repræsenteret ved links (eller kanter ). Dette videnskabelige felt låner teorier og metoder fra grafteori , statistisk mekanik , datamining og informationsvisualisering fra datalogi , inferensmodellering fra statistik og social struktur fra sociologi. US National Research Council definerer netværksvidenskab som "studiet af netværksrepræsentationer af fysiske, biologiske og sociale fænomener, der fører til prædiktive modeller af disse fænomener." [en]
Studiet af netværk er blevet stødt på i forskellige discipliner og brugte denne model som et middel til at analysere komplekse og forbundne data. Den tidligste artikel i dette område er den berømte artikel om de syv Königsberg-broer , skrevet af Leonhard Euler i 1736. Eulers matematiske beskrivelse af hjørner og kanter blev grundlaget for grafteori, en gren af matematikken, der studerer egenskaberne af parvise forbindelser i en netværksstruktur. Grafteori udviklet og fundet anvendelse i kemi [2] .
Denes König , en ungarsk professor i matematik, skrev den første bog om grafteori i 1936 med titlen The Theory of Finite and Infinite Graphs [3] .
I 1930'erne ankom Jacob Levi Moreno , en psykolog, der arbejder i traditionen for gestaltpsykologi , til USA. Han udviklede et sociogram og præsenterede det for offentligheden i april 1933 ved konferencen for medicinstuderende. Moreno hævdede, at "før opfindelsen af sociometri vidste ingen præcis, hvordan den interpersonelle struktur i en gruppe så ud" [4] . Et sociogram var en repræsentation af den sociale struktur hos en gruppe folkeskoleelever. Drenge var venner med drenge, og piger var venner med andre piger, med kun én undtagelse: en af drengene sagde, at han kunne lide én pige, men følelsen var ikke gensidig. Netværksrepræsentationen af den sociale struktur gjorde et så stærkt indtryk, at der blev skrevet om det i The New York Times [5] . Sociogrammet har fundet mange anvendelser; på grundlag af det er der formuleret tilgange til analyse af sociale netværk .
Anvendelsen af sandsynlighedsteori til netværksvidenskab udviklede sig som en udløber af grafteori i form af Pal Erdős og Alfred Rényis otte berømte artikler om tilfældige grafer . For sociale netværk er den eksponentielle tilfældige grafmodel eller p* en glimrende ramme, der bruges til at repræsentere rummet af probabilistiske forbindelser, der optræder i et socialt netværk . En alternativ tilgang til probabilistiske netværksstrukturer er netværkssandsynlighedsmatrixen , som modellerer sandsynligheden for, at kanter forekommer i et netværk baseret på den historiske tilstedeværelse eller fravær af en kant i nye netværk.
I 1998 introducerede David Crackhard og Kathleen Carley ideen om et metanet med PCANS-modellen. De foreslog, at "alle organisationer er struktureret i tre retninger, enkeltpersoner, opgaver og ressourcer". Deres papir introducerede konceptet om, at netværk opstår fra forskellige retninger og derfor er indbyrdes forbundet. Dette område er vokset til et andet underområde af netværksvidenskab kaldet dynamisk netværksanalyse .
På det seneste har andre videnskabelige bestræbelser fokuseret på den matematiske beskrivelse af forskellige netværkstopologier . Duncan Watts kombinerede dataene på netværkene med en matematisk repræsentation, der beskriver "Small World"-grafen . Albert-Laszlo Barabashi og Reka Albert udviklede et skala-invariant netværk , som generelt definerer en netværkstopologi, der indeholder knudepunkter (hubs) med mange forbindelser, hvis antal vokser, og holder et konstant forhold mellem antallet af forbindelser i forhold til antallet af alle noder. Selvom mange netværk, såsom internettet, ser ud til at bevare dette forhold, har andre netværk lange haler af nodefordelinger, der kun tilnærmelsesvis bevarer skalainvarians.
Det amerikanske militær var det første (i 1996) til at interessere sig for netværkscentreret krigsførelse som et krigsbegreb baseret på netværksvidenskab. John A. Parmentola, US Army Director for Research and Laboratory Management , erklærede ved hærens bestyrelse for videnskab og teknologi (BAST ) 1. december 2003, at netværksvidenskab er ved at blive et nyt forskningsområde i hæren. BAST, afdelingen for ingeniør- og fysikalske videnskaber i National Research Council (NRC ) i Statens Videnskabsakademi, er bemyndiget til at organisere diskussioner om videnskabelige og teknologiske presserende spørgsmål for hæren og udøve tilsyn med uafhængige hærrelaterede undersøgelser udført af videnskabsakademi. BAST undersøger, om udformning og finansiering af et nyt felt, netværksvidenskab, kan hjælpe med at lukke kløften mellem behovet for netværkscentrerede operationer og den nuværende primitive tilstand af grundlæggende netværksviden.
Som et resultat udgav BAST i 2005 et NRC-forskningspapir med titlen "Network Science", som definerer et nyt kerneforskningsområde inden for netværksvidenskab for militæret. Baseret på resultaterne og anbefalingerne fra dette arbejde og på den efterfølgende NRC-rapport fra 2007 med titlen "Strategy for the Army Network Science, Technology and Experimental Centres", er store hærens forskningsressourcer blevet omdirigeret til at igangsætte nye store forskningsprogrammer inden for netværksvidenskab. For at opbygge nye teoretiske grundlag for komplekse netværk, understøttes nogle nye nøglepunkter inden for netværksvidenskabelig forskning rettet mod hærens laboratorier:
Introduceret i 2004 af Frederick I. Moxley og støttet af David S. Alberts, hjalp Forsvarsministeriet med at etablere det første Network Science Center med United States Military Academy ( USMA ) i den amerikanske hær . Under ledelse af Moxley- og USMA-medarbejdere blev der oprettet et tværfagligt bachelornetværksvidenskabskursus for West Point- kadetter . For bedre at implementere det grundlæggende i netværksvidenskab blandt fremtidige ledere, grundlagde USMA også et fem-disciplin kursus.
I 2006 dannede den amerikanske hær og Det Forenede Kongerige (UK) International Technology Alliance ( eng. International Technology Alliance ) for Network and Information Science ( eng. the Network and Information Science ), et fælles partnerskab mellem Army Research Laboratory, det britiske forsvarsministerium og en konsortiumindustri og universiteter i USA og Storbritannien. Formålet med alliancen er at udføre forskning til støtte for netværkscentrerede operationer til gavn for begge nationer.
I 2009 dannede den amerikanske hær Network Science Technology Cooperative Alliance , en forskningsalliance mellem Army Research Laboratory , CERDEC og et konsortium af 30 amerikanske industrielle forskningscentre. Målet med alliancen er at udvikle en dyb forståelse af fællestræk af sammenflettede sociale/kognitive, informations- og kommunikationsnetværk og som et resultat forbedre vores evne til at analysere, forudsige, designe og påvirke komplekse sammenflettede netværkssystemer af mange slags.
Derefter, som et resultat af disse bestræbelser, sponsorerede det amerikanske forsvarsministerium adskillige forskningsprojekter, der understøttede netværksvidenskab.
Ofte har netværk nogle attributter, der kan beregnes til at analysere netværkets egenskaber og karakteristika. Disse netværksegenskabers adfærd bestemmes ofte af netværksmodeller og kan bruges til at analysere, hvordan en model adskiller sig fra en anden. Mange definitioner for andre termer, der bruges i netværksvidenskab, kan findes i artiklen Glossary of Graph Theory .
Størrelsen af netværket kan forstås som antallet af noder eller, mere sjældent, antallet af kanter , som (for forbundne grafer uden flere kanter) kan variere fra (træ) til ( fuldstændig graf ). I tilfælde af en simpel graf (et netværk, hvor der højst er en (urettet) kant mellem et hvilket som helst par af hjørner, og hvor ingen af hjørnerne er forbundet med sig selv), har vi . Til rettede grafer (ingen løkker) . Til rettede grafer med tilladte sløjfer . For tilfældet med en graf, hvor flere kanter mellem et par hjørner er tilladt .
Tætheden af et netværk med noder er defineret som forholdet mellem antallet af kanter og antallet af mulige kanter i netværket og er givet (i tilfælde af simple grafer) af den binomiale koefficient , som giver
En anden mulig ligning er, hvor bindingerne ikke er orienteret [6] [7] . Dette giver en bedre forståelse af netværkstæthed, da urettede links kan måles.
Tætheden af et netværk uden kantkryds er defineret som forholdet mellem antallet af kanter og det maksimale antal kanter i et netværk med noder uden krydsende kanter , hvilket giver
Graden af en node er antallet af kanter forbundet med den. Nært beslægtet med netværkstæthed er den gennemsnitlige tæthed, (eller, i tilfælde af rettede grafer, . Faktoren 2 i den foregående ligning kommer fra det faktum, at hver kant i en urettet graf bidrager til potenserne af to forskellige toppunkter). I Erdős-Rényi random graph model ( ), kan vi beregne den forventede værdi (svarende til den forventede værdi af et vilkårligt toppunkt) - et tilfældigt toppunkt har mulige andre toppunkter med en forbindelsessandsynlighed . Så .
Den gennemsnitlige længde af den korteste vej beregnes ved at finde den korteste vej mellem alle par af knudepunkter og beregne den gennemsnitlige længde over alle stier (længden er antallet af kanter indeholdt i stien, dvs. afstanden mellem to toppunkter i grafen) . Dette viser os i gennemsnit antallet af trin, der skal tages fra en vært til en anden. Opførselen af den gennemsnitlige korteste vejmiddellængde som funktion af antallet af hjørner i en tilfældig netværksmodel afgør, om modellen afspejler den lille verdenseffekt . Hvis den opfører sig som , genererer modellen en model af små verdensnetværk. Med vækst større end den logaritmiske model giver det ikke en "lille verden". Et særligt tilfælde af vækst er kendt som ultrasmall world effect.
Som et andet middel til at måle netværksgrafer kan vi definere netværksdiameteren som den længste beregnede korteste vej i netværket. Dette er den korteste afstand mellem de to fjerneste noder i netværket. Med andre ord, efter at længden af den korteste vej fra hver knude til alle andre knudepunkter er blevet beregnet, er diameteren den længste af alle beregnede vejlængder. Diameteren er en repræsentation af netværkets lineære størrelse.
Klyngekoefficienten er et mål for egenskaben "alle mine venner kender hinanden". Dette beskrives nogle gange som "min vens venner er mine venner". Mere præcist er klyngekoefficienten for en knude lig med forholdet mellem de eksisterende links, der forbinder knudepunktets naboer med hinanden, til det maksimale antal af sådanne links. Klyngekoefficienten for hele netværket er lig med gennemsnittet af klyngekoefficienterne for alle knudepunkter. En høj klyngekoefficient for et netværk er endnu et tegn på en stram verden .
Klyngningskoefficienten for den -th node er lig med
hvor er lig med antallet af naboer til den i -de node, og er lig med antallet af forbindelser mellem disse naboer. Det maksimale antal mulige forbindelser mellem naboer er således,
Fra et sandsynlighedsteoretisk synspunkt er den forventede lokale klyngekoefficient lig med sandsynligheden for eksistensen af en forbindelse mellem to vilkårligt valgte naboer til den samme knude.
Måden netværket er forbundet på spiller en stor rolle i analysen og fortolkningen af netværket. Netværk er klassificeret i fire kategorier:
Centralitetsscore genererer en rangordning, der forsøger at identificere de vigtigste knudepunkter i netværksmodellen. Forskellige mål for centralitet koder for forskellige kontekster for ordet "betydning". Formidlingsgraden anser for eksempel en node for meget vigtig, hvis den danner broer mellem mange andre noder. Powerfulness betragter derimod en node som meget vigtig, hvis mange andre meget vigtige noder er forbundet med den. Hundredvis af sådanne freder er blevet foreslået i litteraturen.
Tegnene på centralitet er kun nøjagtige til at afsløre de mest centrale noder. Disse foranstaltninger giver sjældent eller nogensinde mening for andre knudepunkter i netværket [8] [9] . Indikatorer er også kun nøjagtige, når de bruges i forbindelse med node-viktighed og har tendens til at "gå forkert" i andre sammenhænge [10] . Forestil dig for eksempel to fællesskaber, der kun er forbundet med en kant mellem de yngste medlemmer af hvert fællesskab. Da overgangen fra et samfund til et andet skal gå igennem denne kant, vil de to juniormedlemmer have en høj grad af mediation. Men da de er unge (tilsyneladende), har de få forbindelser til "vigtige" noder i deres eget samfund, hvilket betyder, at deres grad af indflydelse vil være ret lav.
Begrebet centralitet i sammenhæng med statiske netværk er blevet udvidet baseret på empiriske og teoretiske undersøgelser til dynamisk centralitet [11] i sammenhæng med tidsafhængige og forbigående netværk [12] [13] [14] .
Begrænsningerne af centralitetsforanstaltninger har ført til udviklingen af mere generelle foranstaltninger. To eksempler er nåbarhed , som bruger længdespredningen af tilfældige stier til at måle, hvor tilgængelig resten af netværket er fra en valgt startknude [15] , og forventet styrke , som er afledt af den forventede værdi af infektionsstyrke genereret af noden [8] . Begge disse mål kan kun beregnes meningsfuldt ud fra netværkets struktur.
Netværksmodeller bruges som grundlag for at forstå sammenhængene inden for empiriske komplekse netværk. Forskellige tilfældige grafgenereringsmodeller danner netværksstrukturer, der kan bruges i sammenligning med komplekse netværk i den virkelige verden.
Erdős-Rényi modellen , opkaldt efter Pal Erdős og Alfred Rényi , bruges til at generere tilfældige grafer , hvor kanter dannes mellem noder med lige sandsynlighed. Modellen kan bruges i en probabilistisk metode til at bevise eksistensen af grafer med forskellige egenskaber, eller til at give en streng definition af, hvilke egenskaber der gælder for næsten alle grafer.
For at generere Erdős-Rényi-modellen skal der gives to parametre - det samlede antal knudepunkter n og sandsynligheden p , hvormed et vilkårligt par knudepunkter har en forbindelseskant.
Da modellen er genereret uden præjudice for visse noder, er fordelingen af noder efter antallet af forbindelser binomial - for en tilfældigt valgt node ,
I denne model er klyngekoefficienten næsten helt sikkert 0 . Adfærd kan opdeles i tre områder.
Subkritisk : Alle komponenter er enkle og meget små, den største komponent er af størrelse ;
Kritisk : ;
Superkritisk : hvor er den positive løsning af ligningen .
Den største tilsluttede komponent har en høj kompleksitet. Alle andre komponenter er enkle og små .
For konfigurationsmodellen vælges en sekvens af toppunktsgrader [16] [17] eller en fordeling af toppunktsgrader [18] [19] (som derefter bruges til at generere en sekvens af toppunkter) som input, og en tilfældigt forbundet graf er oprettet med bevarelse af alle toppunkter i sekvensen. Det betyder, at for et givet valg af gradrækkefølge, vælges grafen ensartet fra sættet af alle grafer, der har en sådan rækkefølge af toppunktsgrader. Graden af et tilfældigt valgt toppunkt er en uafhængig og ligeligt fordelt stokastisk variabel med heltalsværdier. Når konfigurationsgrafen indeholder en kæmpe forbundet komponent , som har en ubegrænset størrelse [17] . Resten af komponenterne har endelige størrelser, der kan kvantificeres ved hjælp af en størrelsesfordeling. Sandsynligheden for , at en tilfældigt valgt knude er forbundet med en størrelseskomponent, er givet ved graden af foldning af gradfordelingen [20]
w ( n ) = { E [ k ] n − en u en ∗ n ( n − 2 ) , n > en , u ( 0 ) n = en , {\displaystyle w(n)={\begin{cases}{\frac {\mathbb {E} [k]}{n-1}}u_{1}^{*n}(n-2),&n> 1,\\u(0)&n=1,\end{cases}}}hvor betyder fordelingen af noder efter antallet af links og . En kæmpe komponent kan ødelægges ved tilfældigt at fjerne en kritisk brøkdel af alle hjørner. Denne proces kaldes perkolation (lækage) på tilfældige netværk . Hvis det andet moment af fordelingsgraden er endeligt, det vil sige , er denne kritiske kantbrøk givet af ligheden [21]
og den gennemsnitlige afstand mellem hjørner i den gigantiske komponent er logaritmisk proportional med den samlede størrelse af netværket [18] .
I den orienterede konfigurationsmodel er graden af en node givet af to tal, input semidegree og output semidegree , og følgelig vil fordelingen af toppunktsgrader være bivariate. Det forventede antal indgående og udgående kanter er det samme, så . En orienteret konfigurationsmodel indeholder en gigantisk komponent, hvis og kun hvis [22]
2 E [ k i ] E [ k i k ud ] − E [ k i ] E [ k ud 2 ] − E [ k i ] E [ k i 2 ] + E [ k i 2 ] E [ k ud 2 ] − E [ k i k ud ] 2 > 0. {\displaystyle 2\mathbb {E} [k_{\text{i}}]\mathbb {E} [k_{\text{in}}k_{\text{out}}]-\mathbb {E} [k_ {\text{i}}]\mathbb {E} [k_{\text{out}}^{2}]-\mathbb {E} [k_{\text{i}}]\mathbb {E} [k_ {\text{in}}^{2}]+\mathbb {E} [k_{\text{in}}^{2}]\mathbb {E} [k_{\text{out}}^{2} ]-\mathbb {E} [k_{\text{in}}k_{\text{out}}]^{2}>0.}Bemærk, at og er ens, og derfor er udskiftelige i den sidste ulighed. Sandsynligheden for, at et tilfældigt udvalgt toppunkt tilhører en størrelseskomponent , er givet ved formlen [23]
h i ( n ) = E [ k jeg n ] n − en u ~ i ∗ n ( n − 2 ) , n > en , u ~ i = k i + en E [ k i ] ∑ k ud ≥ 0 u ( k i + en , k ud ) , {\displaystyle h_{\text{in}}(n)={\frac {\mathbb {E} [k_{in}]}{n-1}}{\tilde {u}}_{\text{in }}^{*n}(n-2),\;n>1,\;{\tilde {u}}_{\text{in}}={\frac {k_{\text{in}}+ 1}{\mathbb {E} [k_{\text{in}]}}\sum \limits _{k_{\text{out}}\geq 0}u(k_{\text{in}}+1 ,k_{\tekst{ud)))}for indgående komponenter, og
til udgående komponenter.
Watts-Strogatz-modellen er en tilfældig grafgenereringsmodel, der producerer grafer med egenskaber for "lille verden" .
For at generere Watts-Strogatz-modellen bruges den indledende gitterstruktur. Hvert knudepunkt i netværket er oprindeligt forbundet med dets nærmeste naboer. En anden parameter angiver sandsynligheden for omledning. Hver kant har en sandsynlighed for , at den vil blive omkoblet til grafen som en tilfældig kant. Det forventede antal rewired forbindelser i modellen er .
Da Watts-Strogatz-modellen starter som en ikke-tilfældig gitterstruktur, har den en meget høj klyngefaktor sammen med en høj gennemsnitlig vejlængde. Hver omledning vil sandsynligvis skabe en genvej mellem stærkt forbundne klynger. Efterhånden som sandsynligheden for omledning stiger, falder klyngekoefficienten langsommere end den gennemsnitlige vejlængde. Som et resultat heraf tillader dette den gennemsnitlige netværksvejlængde at falde betydeligt med et lille fald i klyngekoefficienten. Høje værdier af p resulterer i mere edge omledning, hvilket gør Watts-Strogatz-modellen til et tilfældigt netværk som resultat.
Barabasi-Albert- modellen er en tilfældig netværksmodel, der bruges til at demonstrere præferencetilknytning eller effekten af de rige bliver rigere. I denne model er det mest sandsynligt, at en kant forbindes til noder med de højeste grader. Netværket starter med et netværk med m 0 noder, hvor , og graden af hver node i det indledende netværk skal være mindst 1, ellers vil noden for altid forblive afbrudt fra resten af netværket.
I Barabasi-Albert-modellen tilføjes nye noder til netværket én ad gangen. Hver ny node forbindes til eksisterende noder med en sandsynlighed, der er proportional med antallet af allerede eksisterende noder. Formelt set er sandsynligheden for , at en ny node er forbundet til node i [ 24]
hvor k i er graden af node i . De mest tilsluttede noder ("hubs") har en tendens til hurtigt at akkumulere endnu flere forbindelser, mens noder med færre forbindelser sandsynligvis ikke bliver valgt som en ny forbindelse. Nye noder har den "fordel" at slutte sig til de i forvejen stærkest forbundne noder.
Fordelingen af noder efter antallet af links opnået fra BA-modellen er skalainvariant , især er det en magtlov af formen
Hubs viser en høj grad af formidling, hvilket tillader korte veje mellem noder. Som følge heraf har BA-modellen en tendens til at have meget korte gennemsnitlige vejlængder. Denne models klyngekoefficient har også en tendens til 0. Mens diameteren D på mange modeller, inklusive Erdős-Rényi tilfældige grafmodellen og nogle tætte netværk , er proportional med log N, viser BA-modellen D~loglogN (ultra- stram verden) [26] .
Mellemliggende tilknytningsmodelI den formidlingsdrevne tilknytningsmodel ( formidlingsdrevet vedhæftning , MDA) kommer en ny node med kanter , for hvilke en eksisterende forbundet node er tilfældigt udvalgt, og den nye node er forbundet ikke kun til denne tilfældigt valgte node, men også til sine naboer, også valgt tilfældigt. Sandsynligheden for , at en naboknude til en eksisterende knude er valgt er
Multiplikatoren er lig med den reciproke af det harmoniske middelværdi (OSG) af kræfterne for knudepunktets naboer . En omfattende numerisk undersøgelse tyder på, at gennemsnitsværdien af GRG generelt har en tendens til en konstant, hvilket betyder, at . Det følger heraf, at jo flere forbindelser (grad) en knude har, jo større er chancen for at få flere forbindelser, da de kan opnås på en lang række måder gennem mellemmænd, hvilket i det væsentlige inkarnerer den intuitive idé om "de rige bliver rigere " (eller reglen om præferencetilknytning Barabashi-Albert-modeller). Derfor adlyder MDA-netværk, som det kan forstås, PA-reglen, men i en implicit form [27] .
Men når vi får mekanismen "vinderen tager alt", da næsten det samlede antal noder har en grad på én, og en node bliver superrig. Efterhånden som værdien stiger, falder misforholdet mellem de superrige og de fattige, og ved observerer vi en overgang fra mekanismen "rig bliver superrig" til mekanismen "rige bliver rigere".
En anden model, hvor karakteren af toppunktet er nøgleingrediensen, blev foreslået af Caldarelli et al . [28] . Her skabes et link mellem to toppunkter med en sandsynlighed givet af linkfunktionen i kortlægningsmodellen af de involverede toppunkter. Graden af et toppunkt i er givet ved formlen [29]
Hvis er en reversibel stigende funktion af , så er sandsynlighedsfordelingen givet af formlen
Som et resultat, hvis korrespondancen er fordelt i henhold til en magtlov, så er graderne af noder også.
Mindre indlysende med en hurtigt faldende sandsynlighedsfordeling sammen med en koblingsfunktion af formularen
med en konstant og en Heaviside funktion , at vi får skala-invariante netværk.
En sådan model er med succes blevet anvendt til at beskrive handel mellem nationer ved at bruge BNP som et passende mål for forskellige knudepunkter og en koblingsfunktion af formen [30] [31]
Social netværksanalyse udforsker strukturen af relationer mellem sociale aktører [6] . Disse enheder er ofte mennesker, men kan også være grupper , organisationer , nationalstater , websteder , videnskabelige publikationer .
Siden 1970'erne har den empiriske undersøgelse af netværk spillet en central rolle i samfundsvidenskaben, og mange af de matematiske og statistiske værktøjer, der bruges til at studere netværk, er blevet udviklet i sociologien [32] . Blandt mange andre applikationer bruges social netværksanalyse til at forstå spredningen af innovation , nyheder og rygter. Ligeledes kan det bruges til at studere både spredning af sygdom og sundhedsrelateret adfærd . Det er også blevet anvendt til markedsundersøgelser , hvor det er blevet brugt til at teste tillidens rolle i vare-penge-relationer og sociale mekanismer i prisdannelsen. På samme måde er det blevet brugt til at studere involvering i politiske bevægelser og sociale organisationer. Det er også blevet brugt til at give mening om videnskabelige kontroverser og akademisk omdømme. For nylig er netværksanalyse (og dens nærmeste slægtning, trafikanalyse ) blevet brugt i vid udstrækning i militær efterretning for at afdække sociale modstandsnetværk, der er både hierarkiske og lederløse af natur [33] [34] .
Dynamisk netværksanalyse udforsker ændringen i strukturen af forbindelser mellem forskellige klasser af objekter i komplekse socio-tekniske systemer og afspejler social stabilitet og ændringer, såsom fremkomsten af nye grupper, diskussioner og ledere [11] [12] [ 13] [14] [35] . Dynamisk netværksanalyse fokuserer på metanetværk sammensat af noder af mange forskellige slags (objekter) og flere typer links . Disse objekter kan variere meget [11] . Eksempler omfatter mennesker, organisationer, temaer, ressourcer, opgaver, begivenheder, steder og overbevisninger.
Dynamiske netværksteknikker er især nyttige til at evaluere trends i et netværk over tid, identificere nye ledere og udforske den fælles udvikling af mennesker og ideer.
Med den nylige eksplosion af offentligt tilgængelige biologiske data har analysen af molekylære netværk fået stor interesse. Analyse under disse forhold er tæt forbundet med social netværksanalyse, men fokuserer ofte på lokale mønstre i netværket. Netværksmotiver er for eksempel små undergrafer, der er overrepræsenteret i netværket. Aktivitetsmotiver er som overrepræsenterede mønstre i egenskaberne af noder og kanter i et netværk, der er overrepræsenteret i netværksstrukturen. Analysen af biologiske netværk har ført til udviklingen af netværksmedicin , som overvejer virkningen af sygdomme i interaktomet [36] .
Linkanalyse er en delmængde af netværksanalyse, der undersøger sammenhænge mellem objekter. Et eksempel kunne være at se på adresserne på mistænkte og ofre, de telefonnumre, de ringede til, de økonomiske transaktioner, de var involveret i i det pågældende tidsrum, og forholdet mellem disse enheder som led i en politiefterforskning. Linkanalyse giver her kritiske relationer og associationer mellem et meget stort antal objekter af forskellig art, som ikke er tydelige, når man betragter informationer isoleret. Automatiseret linkanalyse bliver i stigende grad udnyttet af banker og forsikringsbureauer til at afsløre svindel , teleoperatører til at analysere kommunikationsnetværk, medicinske forskere i epidemiologi og farmakologi , retshåndhævelse til undersøgelser , søgemaskiner til vurderingsrelevans ( og omvendt af spammere til spamdexing og virksomhedsejere ), til søgemaskineoptimering ), såvel som hvor som helst relationer mellem et stort antal objekter analyseres.
NetværksresiliensStrukturel stabilitet af netværk [37] studeres ved hjælp af perkolationsteori . Når en kritisk del af noder fjernes fra netværket, opdeles netværket i små klynger. Dette fænomen kaldes perkolation [38] og repræsenterer en type "ordre-forstyrrelse" faseovergang med et kritisk indeks .
PandemianalyseSIR-modellen i epidemiologi er en af de mest kendte algoritmer til at forudsige spredningen af globale pandemier i en inficeret befolkning.
Fra en tilstand af modtagelighed til infektionFormlen ovenfor beskriver "styrken" af infektion for hver modtagelig enhed i en inficeret population, hvor den svarer til spredningshastigheden af sygdommen.
Sådan sporer du ændringer i denne modtagelige enhed i en inficeret population:
Fra infektion til bedringOver tid afhænger antallet af sådanne infektioner af målhastigheden for bedring, repræsenteret ved antallet , men over den gennemsnitlige infektionsperiode , af antallet af inficerede individer og af antallet af ændringer over tid .
Smitsom periodeHvorvidt en befolkning er ramt af en pandemi, set fra SIR-modellens synspunkt, afhænger af værdien eller "gennemsnitligt antal inficerede mennesker fra andre mennesker."
WeblinkanalyseAdskillige søgemaskinerangeringsalgoritmer bruger linkbaserede mål for centralitet, herunder (i rækkefølge ) Hyper Search , Googles PageRank , Kleinbergs HITS , . Linkanalyse kan udføres i informationsteori for at forstå og udtrække information fra et sæt websider. Det kan for eksempel være en analyse af links mellem hjemmesider eller blogs af politikere.
PageRankPageRank fungerer ved tilfældigt at vælge et "site" eller en internetside og "springe tilfældigt" til andre sider med en vis sandsynlighed. Tilfældige hits til disse andre noder gør det muligt for PageRank-estimatet at omgå netværket fuldstændigt, da nogle sider er i netværkets periferi og ikke let kan vurderes.
Hver node har en PageRank, defineret som summen, for sider, af de gensidige af antallet af sider, der er knyttet til noden ved udgående buer, eller nodens "outcome semidegree" gange nodens "vigtighed" eller PageRank .
Tilfældige overgangeSom forklaret ovenfor udfører PageRank tilfældige overgange i et forsøg på at tildele en PageRank til hver side på internettet. Disse tilfældige navigationer finder websteder, der ikke kan findes som et resultat af normale søgemetoder såsom bredde - først-søgning og dybde -først-søgning .
En forbedring af ovenstående formel til bestemmelse af PageRank inkluderer komponenterne i disse tilfældige overgange. Uden tilfældige overgange vil nogle sider få PageRank lig med 0, hvilket ikke er godt.
Den første komponent er , eller sandsynligheden for, at en tilfældig overgang vil ske. Det modsatte er "dæmpningsfaktor", eller .
En anden vinkel på dette:
Information om den relative betydning af knudepunkter og kanter i grafer kan opnås gennem mål for centralitet , som er meget udbredt i discipliner som sociologi . Centralitetsforanstaltninger er nødvendige, når netværksanalyse ikke besvarer spørgsmål som: "Hvilke noder i netværket skal bruges til at sikre, at en besked eller information forplanter sig til alle eller de fleste noder i netværket?" eller omvendt "Hvilke knuder skal påvirkes for at stoppe spredningen af sygdommen?". De formelt definerede mål for centralitet er graden af forbindelse , graden af nærhed , graden af mediation , graden af indflydelse og Katz centralitet . Målet med netværksanalyse forudbestemmer sædvanligvis typen af centralitetsmål, der anvendes [6] .
Indhold i et komplekst netværk kan distribueres på to hovedmåder: vedvarende distribution og ikke-vedvarende distribution [40] . Med vedvarende distribution forbliver den samlede mængde indhold, der kommer ind i komplekse netværk, konstant, når det passerer gennem netværket. Den vedvarende distributionsmodel kan bedst repræsenteres af en krukke indeholdende en vis mængde vand, som hældes i en række afløb forbundet med rør. Her repræsenterer kanden kilden, og vandet repræsenterer indholdet, der skal distribueres. Tanke og forbindelsesrør repræsenterer henholdsvis knudepunkter og knudepunkter. Når vand passerer fra en beholder til en anden, forsvinder vandet fra kildebeholderen. Ved ikke-vedvarende distribution ændres mængden af indhold, når det passerer gennem komplekse netværk. Den ikke-konserverende formeringsmodel er bedst repræsenteret ved en kontinuerlig strøm fra en vandhane, der spredes over afløb forbundet med rør. Her er mængden af vand fra den oprindelige kilde ikke begrænset. Også ethvert afløb, som vandet er nået til, fortsætter med at modtage vand, selvom det passerer til andre afløb. Ikke-konserverede modeller er bedst egnede til at forklare overførslen af de fleste infektioner .
I 1927 skabte W. O. Kermack og A. G. McKendrick en model, hvor de betragter en fast befolkning med kun tre stater - modtagelige, , inficerede, og helbredte, . De kategorier, der anvendes i denne model, består af tre klasser:
Strømmen af denne model kan ses som følger:
Ved at bruge en fast population udledte Kermack og McKendrick følgende ligninger:
Nogle antagelser blev gjort for at formulere disse ligninger. For den første ligning skal et enkelt medlem af befolkningen anses for at have samme sandsynlighed for infektion som ethvert andet medlem, med en rate på , som anses for at være den hastighed, hvormed infektionen eller sygdommen spredes. Derfor, når en inficeret repræsentant kommer i kontakt og er i stand til at overføre sygdommen til andre repræsentanter pr. tidsenhed, er andelen af kontakter af inficerede repræsentanter med modtagelige repræsentanter lig med . Antallet af nye infektioner pr. tidsenhed pr. smittet person er så lig med , hvilket sætter antallet af nye infektioner s (eller dem, der forlader den modtagelige kategori) som [41] . For den anden og tredje ligning antages det, at populationen forlader den modtagelige klasse med samme hastighed, som den går ind i den inficerede klasse. Antallet er dog lig med andelen ( repræsenterer den gennemsnitlige restitutionsgrad og repræsenterer den gennemsnitlige sygdomstid) af inficerede mennesker, der forlader denne klasse pr. tidsenhed og flytter ind i klassen af restituerede. Disse samtidige processer omtales som massehandlingens lov , den bredt accepterede idé om, at kontakthastigheden mellem to grupper i en befolkning er proportional med størrelsen af hver af de to grupper, der er under overvejelse [42] . Endelig antages det, at infektions- og bedringsraten er meget større end fødsel og død, og derfor er disse faktorer ikke taget i betragtning i modellen.
Du kan læse mere om denne model på Epidemic Model- siden .
Hovedligningen kan udtrykke adfærden af et ikke-rettet voksende netværk, hvor der ved hvert trin tilføjes en ny node forbundet til en gammel node (tilfældigt valgt og uden præferencer). Det indledende netværk består af to noder og to forbindelser mellem dem på det tidspunkt . En sådan konfiguration er kun nødvendig for at forenkle yderligere beregninger, så netværket på det tidspunkt har noder og links.
Den kinetiske hovedligning for dette netværk
hvor er sandsynligheden for at have en node med grad på tidspunktet , og er det tidspunkt, hvor noden blev tilføjet til netværket. Bemærk, at der kun er to måder, hvorpå den gamle node kan have forbindelser på et tidspunkt :
Efter at have forenklet denne model, vil fordelingen af noder efter antallet af links være lig med [43] .
Baseret på dette voksende netværk udvikler epidemimodellen sig efter følgende enkle regel: Hver gang en ny node tilføjes, og efter at have valgt hvilken node der skal oprettes forbindelse til, besluttes det, om denne node vil blive inficeret eller ej. Den grundlæggende ligning for denne epidemiske model er
hvor definerer infektion ( ) eller fravær af infektion ( ). Efter at have løst denne grundlæggende ligning får vi følgende løsning: [44] .
Et indbyrdes afhængigt netværk er et system af forbundne netværk, hvor knudepunkterne i et eller flere netværk afhænger af knudepunkterne i andre netværk. Sådanne afhængigheder udvides af udviklingen inden for moderne teknologier. Afhængigheder kan forårsage kaskadeskader mellem netværk, og relativt små skader kan føre til katastrofale systemfejl. Strømafbrydelser er en dejlig demonstration af vigtigheden af den rolle, som netforbindelser spiller. For nylig er konceptet med at studere kaskadeforstyrrelser i et system af indbyrdes afhængige netværk blevet udviklet [45] [46] .
Flerlagsnetværk er netværk med flere typer links [47] [48] [49] [50] [51] [52] . Stadig mere sofistikerede forsøg på at modellere systemer i den virkelige verden efterhånden som multiple forbundne netværk har givet værdifuld viden inden for social netværksanalyse [48] [49] [53] [54] [55] [56] , økonomi, historie [57] , by og international transport [58] [59] [60] [61] , økologi [62] [63] [64] [65] , psykologi [66] , medicin, biologi [67] , handel, klimatologi, fysik [68] [69] , neuroinformatik [70] [71] [72] Finansiel driftsstyring.
Netværksproblemer, der bruger søgningen efter den optimale vej til ethvert formål, studeres under navnet kombinatorisk optimering . Eksempler inkluderer netværksflows , korteste vejproblem , transportproblem , transportproblem objektplaceringsproblem , matchningsproblem , tildelingsproblem , pakkeproblem , routingproblem , kritisk vejmetode og PERT- projekter ( Evaluation and Analysis Method).