Semantisk web

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 22. marts 2022; checks kræver 2 redigeringer .

Det semantiske netværk er en informationsmodel af emneområdet , har form af en rettet graf . Grafens hjørner svarer til objekterne i emneområdet, og buerne (kanterne) definerer forholdet mellem dem. Objekter kan være: koncepter , hændelser , egenskaber, processer [1] . Således er det semantiske web en af måderne at repræsentere viden på .

Navnet kombinerer termer fra to videnskaber: semantik i lingvistikstudier betydningen af sprogenheder, og et netværk i matematik er en slags graf - et sæt knudepunkter forbundet med buer (kanter), som er tildelt et bestemt nummer. I det semantiske netværk spilles nodernes rolle af videnbasens begreber , og buerne (i øvrigt rettet) definerer forholdet mellem dem. Det semantiske netværk afspejler således fagområdets semantik i form af begreber og relationer.

Det er forkert at sætte lighedstegn mellem begreberne "Semantic Network" ( eng. Semantic Network ) og " Semantic Web " ( eng. Semantic Web ). Selvom disse begreber ikke er ækvivalente, er de ikke desto mindre relaterede (se nedenfor ).

Historie

Ideen om systematisering på grundlag af enhver semantisk relation blev foreslået af videnskabsmænd fra tidlig videnskab. Carl Linnaeus' biologiske klassifikation fra 1735 er et eksempel på dette . Betragtet som et semantisk netværk bruger denne klassifikation en delmængderelation, moderne AKO (fra engelsk "A Kind Of", "variety").

Forfædre til moderne semantiske netværk kan betragtes som eksistentielle grafer foreslået af Charles Pierce i 1909 . De blev brugt til at repræsentere logiske udsagn i form af specielle diagrammer. Peirce kaldte denne metode "fremtidens logik."

En vigtig retning i studiet af netværk var den tyske psykolog Otto Selz' arbejde i 1913 og 1922. I dem brugte han grafer og semantiske relationer for at organisere strukturerne af begreber og associationer samt for at studere metoderne til nedarvning af egenskaber. Forskerne M. Anderson (1973), D. Norman (1975) og andre brugte disse værker til at modellere menneskelig hukommelse og intellektuelle egenskaber.

Computer Semantic Networks blev udviklet i detaljer af Richard Richens i 1956 som en del af Cambridge Language Learning Centers maskinoversættelsesprojekt . Processen med maskinoversættelse er opdelt i 2 dele: oversættelse af kildeteksten til en mellemform for repræsentation, og derefter oversættes denne mellemform til det ønskede sprog. Semantiske netværk var netop sådan en mellemform. I 1961 dukkede Masterman op , hvor hun blandt andet definerede et grundlæggende ordforråd for 15.000 begreber. Disse undersøgelser blev videreført af Robert Simmons (1966), J. Wilkes (1972) og andre videnskabsmænd.

Værker om semantiske netværk refererer ofte til den amerikanske psykolog Ross Quillians arbejde om " semantisk hukommelse " [2] .

Struktur

Matematik giver dig mulighed for at beskrive de fleste af fænomenerne i verden omkring dig i form af logiske udsagn. Semantiske netværk opstod som et forsøg på at visualisere matematiske formler. Hovedrepræsentationen for det semantiske web er grafen . Men glem ikke, at bag det grafiske billede er der bestemt en streng matematisk notation, og at begge disse former viser det samme.

Grafisk repræsentation

Den vigtigste form for repræsentation af det semantiske netværk er en graf. Begreberne i det semantiske netværk er skrevet i ovaler eller rektangler og er forbundet med pile med billedtekster - buer (se fig.). Dette er den mest bekvemme form, som en person opfatter. Dens mangler viser sig, når vi begynder at bygge mere komplekse netværk eller forsøger at tage højde for det naturlige sprogs egenskaber. Skemaer af semantiske netværk, hvorpå retningerne for navigationsrelationer er angivet, kaldes videnskort, og deres helhed, som gør det muligt at dække store dele af det semantiske netværk, kaldes et vidensatlas.

Matematisk notation

I matematik er en graf repræsenteret af et sæt toppunkter V og et sæt af relationer mellem dem E. Ved hjælp af matematisk logiks apparat konkluderer vi, at hvert toppunkt svarer til et element i objektmængden, og buen svarer til et prædikat .

Sproglig notation

I lingvistik optages relationer i ordbøger og synonymordbog . I ordbøger, i definitioner gennem slægt og specifik forskel, indtager det generiske begreb en bestemt plads. I tesauri, i artiklen af hvert udtryk, kan alle mulige forbindelser med andre relaterede termer angives. Fra sådanne tesaurier er det nødvendigt at skelne informationssøgningstesauri med lister over søgeord i artikler, der er beregnet til drift af deskriptorsøgemaskiner.

Klassifikation af semantiske netværk

For alle semantiske netværk er opdelingen efter aritet og antallet af typer af relationer retfærdig.

Ved antallet af typer af relationer kan netværk være homogene og heterogene .
- Homogene netværk har kun én type forhold (pile), såsom førnævnte artsklassifikation (med et enkelt forhold AKO ).
- I heterogene netværk er antallet af relationstyper mere end én. Klassiske illustrationer af denne model for videnrepræsentation repræsenterer netop sådanne netværk. Heterogene netværk er af mere interesse for praktiske formål, men også vanskeligere for forskning. Heterogene netværk kan repræsenteres som en sammenvævning af trælignende flerlagsstrukturer. Et eksempel på et sådant netværk ville være Wikipedia Semantic Network.
Efter arity:
- netværk med binære relationer (der forbinder præcis to begreber) er typiske . Binære relationer er meget enkle og bekvemt afbildet på en graf som en pil mellem to begreber. Derudover spiller de en enestående rolle i matematik.
- I praksis kan du dog have brug for relationer, der forbinder mere end to objekter - N-ær . I dette tilfælde opstår der vanskeligheder - hvordan man afbilder en sådan forbindelse på en graf for ikke at blive forvirret. Konceptuelle grafer (se nedenfor ) fjerner denne vanskelighed ved at repræsentere hver relation som en separat node.
Til størrelse:
- For at løse specifikke problemer, for eksempel dem, der løses af kunstige intelligenssystemer.
- En industri-skala semantisk web bør tjene som grundlag for skabelsen af specifikke systemer, uden at hævde at være af universel betydning.
- Globalt semantisk netværk. Teoretisk set burde et sådant netværk eksistere, da alt i verden er forbundet med hinanden . Måske vil World Wide Web en dag blive et sådant netværk .

Ud over konceptuelle grafer er der andre ændringer af semantiske netværk, dette er et andet grundlag for klassificering ( ved implementering ). Se det relevante afsnit nedenfor for flere detaljer .

Semantiske relationer

Antallet af typer relationer i det semantiske netværk bestemmes af dets skaber, baseret på specifikke mål. I den virkelige verden har deres antal en tendens til uendeligt. Hver relation er faktisk et prædikat, simpelt eller sammensat. Hurtigheden af at arbejde med videnbasen afhænger af, hvor effektivt programmerne til behandling af de nødvendige relationer implementeres.

Hierarkisk

Oftest er der behov for at beskrive forholdet mellem elementer, mængder og dele af objekter. Forholdet mellem et objekt og et sæt, der angiver, at objektet tilhører dette sæt, kaldes en klassifikationsrelation ( ISA ). Et sæt (klasse) siges at klassificere sine forekomster . [3] (eksempel: "Ballon er en hund" = Ballon er et objekt af typen hund ). Nogle gange kaldes denne relation også MemberOf, InstanceOf eller lignende. ISA-kommunikation antager, at et objekts egenskaber nedarves fra et sæt. Det omvendte forhold til ISA bruges til at betegne eksempler, hvorfor det kaldes "Eksempel", eller på russisk "Eksempel". Hierarkiske relationer danner en træstruktur .

Forholdet mellem et supersæt og et undersæt (kaldet AKO - "A Kind Of", "varietet"). (Eksempel: "hund er et dyr" = typen med navn hund er en undertype af typen dyr ). Et element i en delmængde kaldes et hyponym ( hund ), og et supersæt kaldes et hypernym ( dyr ), og selve relationen kaldes en hyponym relation . Alternative navne er "SubsetOf" og "Subset". Denne relation bestemmer, at hvert element i det første sæt er inkluderet i det andet (ISA udføres for hvert element), samt en logisk forbindelse mellem selve delmængderne: at det første ikke er større end det andet og egenskaberne for det første sæt er nedarvet fra den anden. AKO-relationen (Rod-View) bruges ofte til navigation i informationsrummet.

Et objekt består som regel af flere dele eller elementer. Eksempelvis består en computer af en systemenhed, skærm, tastatur, mus osv. Et vigtigt forhold er HasPart , som beskriver sammenhængen mellem dele og helheden - meronymi-relationen . I dette tilfælde nedarves egenskaberne for det første sæt ikke af det andet. Meronym og holonym er modsatte begreber:
- Et meronym er en genstand, der er en del af en anden. ( Motor er et meronym for en bil .)
- Et holonym er et objekt, der omfatter noget andet. (For eksempel har et hus et tag. Hus er et holonym for et tag . En computer er et holonym for en skærm .)

Ofte i semantiske netværk er det nødvendigt at definere forholdet mellem synonymi og antonymi . Disse forbindelser duplikeres enten eksplicit i selve netværket eller bestemmes af den algoritmiske komponent.

Hjælpe

I semantiske netværk bruges følgende relationer også ofte :

funktionelle forbindelser (normalt defineret af verberne "producerer", "påvirker" ...);
kvantitativ (større end, mindre end, lig med…);
rumlig (langt fra, tæt på, bagved, under, over ...);
midlertidig (tidligere, senere, under ...);
attributiv (at have en egenskab, at have en værdi);
logisk (OG, ELLER, IKKE);
sproglige.

Denne liste kan fortsættes i det uendelige: i den virkelige verden er antallet af forhold enormt. For eksempel kan relationen "helt andre ting" eller lignende bruges mellem begreber: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).

Funktioner ved at bruge nogle typer relationer

I det semantiske netværk kan begreber både være instanser af objekter og deres sæt. Brug af de samme relationer for både elementer og samlinger kan føre til forvirring. Lignende fejl i driften af nogle tidlige systemer blev beskrevet i Drew McDermottsArtificial Intelligence Faces Natural Stupidity

Lad os tage et kig på fire sætninger:

Pavel har en far ved navn Alexei.
For Paul er der en far fra mange mænd.
Der er en person, for hvem Alexei er far.
Hver person har en far til mange mænd.

For en person er betydningen af disse sætninger klar, og mange ville uden tøven sige i alle fire tilfælde, at forholdet er far . Dette er dog en fejl: i det første tilfælde beskrives faktisk forholdet mellem to instanser, men i det andet og tredje - mellem et instans og et sæt, og i det fjerde - et forhold mellem repræsentanter fra to sæt. I matematisk notation ser det således ud for henholdsvis sætning 1-4:

I. ∃ pavel & ∃ alexey: far (alexey, paul); IIa. ∃ paul → ∃ x ∈ mænd : far(x, paul); IIb. ∃ alexey → ∃ y ∈ mennesker : far(alexey, y); III. ∀ y ∈ mennesker → ∃ x ∈ mænd : far(x, y);

Vi ser, at tilfælde IIa og IIb kun adskiller sig i rækkefølgen af variablerne i prædikatet, men dette kan spille en vigtig rolle for netværkets korrekthed. I eksemplet er der kun angivet 4 typer relationer, men der er ni af dem for et binært netværk. De adskiller sig i kvantifikatorerne ∃ og ∀, samt rækkefølgen af variablerne.

Grafisk, for at skelne mellem alle disse tilfælde, bruges specielle former for markeringsrelationer på grafen: For eksempel forbliver relationer af den første slags uændrede, den anden type er skitseret med en rektangulær ramme af prikker, den tredje er en bindestreg, og den fjerde er en streg-prik. Eller du kan bare skrive relationstypeindekset ved siden af.

Den mest almindelige forvirring opstår omkring ISA- relationen . Derfor er det i mange moderne værker accepteret, at ISA betegner forholdet mellem en instans og et sæt (ovenstående tilfælde IIb): Murka ISA kat . En enkelt ramme bruges ikke i dette tilfælde. Hvis det er påkrævet at definere en ækvivalensrelation (tilfælde I), kan der indføres en særlig relation til dette (selvom der for det semantiske web er ringe behov for det). ISA kan bruges til at angive forekomsten af elementer fra et sæt i et andet (tilfælde III), men dette anbefales ikke. For at betegne delmængder bruges en anden speciel relation - AKO . Forskellen mellem ISA i en boks og AKO er, at sidstnævnte også er ansvarlig for at arve egenskaberne for selve sættene, og ikke kun elementerne.

Brug af semantiske netværk

Semantisering

Semantisering er processen med at ændre tekster, hvor der skelnes mellem semantiske relationer uden at ændre deres indhold. Wikipedia har projekter til at semantisere artikler og kategoritræet.

Artikler semantiseres hovedsageligt ved hjælp af skabeloner, hvor nogle kategorier oprettes automatisk.
Semantiseringen af kategoritræet består i at observere transitivitet , skabe metakategorier og organisere strukturen af underkategorier ved hjælp af meningsfulde kriterier.

Det semantiske web

Begrebet hypertekstorganisation ligner et homogent binært semantisk netværk, men der er en væsentlig forskel:

Forbindelsen lavet af et hyperlink har ingen semantik, det vil sige, den beskriver ikke betydningen af denne forbindelse. Formålet med det semantiske netværk er at beskrive forholdet mellem objekter og ikke yderligere information om emneområdet. En person kan finde ud af, hvorfor dette eller hint hyperlink er nødvendigt, men denne forbindelse er ikke klar for computeren.
Hyperlinkede sider er dokumenter , der som regel beskriver problemsituationen som helhed. I et semantisk web repræsenterer hjørner (hvilke relationer forbinder) begreber eller objekter fra den virkelige verden .

Et forsøg på at skabe et semantisk web baseret på World Wide Web er blevet kaldt Semantic Web . Dette koncept involverer brugen af RDF (et XML-baseret markup- sprog ) og har til formål at give links en betydning, som computersystemer kan forstå. Dette vil gøre internettet til en distribueret videnbase på globalt plan.

Software

Se også

Noter

↑ Roussopoulos ND En semantisk netværksmodel af databaser. - TR No 104, Institut for Computer Science, University of Toronto, 1976.
↑ Quillian, M. R. (1968). semantisk hukommelse. Semantisk informationsbehandling, 227-270.
↑ Grundlæggende begreber . Hentet 15. april 2007. Arkiveret fra originalen 25. januar 2007. (ubestemt)

Viden Engineering
Generelle begreber	Data metadata Viden meterkendelse Vidensrepræsentation Vidensgrundlag Ontologi semantisk web
Stive modeller	Produkter Semantiske netværk Rammer Logisk model
Bløde metoder	Neuralt netværk evolutionær modellering sløret logik
Ansøgninger	Ekspertsystemer Data mining Informationsudtrækning Virtuelle samtalepartnere Hybride intelligente systemer
Kunstig intelligens Maskinelæring naturlig sprogbehandling

semantisk web
Grundlæggende	World Wide Web Internet Hypertekst Database Semantiske netværk Ontologier Beskrivelseslogik
Underafsnit	Tilknyttede data data web Hyperdata Server for udførelse af forretningsregler Datarum
Ansøgninger	Semantisk Wiki Semantisk udgivelse Semantisk søgning Semantisk computing semantisk reklame Semantisk ræsonnement mekanisme semantisk matchning semantisk kortlægger semantisk mægler semantisk analyse semantisk serviceorienteret arkitektur
relaterede emner	Folksonomi Bibliotek 2.0 Web 2.0 Links Informationsarkitektur Videnshåndtering kollektiv intelligens Tematiske kort Mindmapping metadata Geotagging webvidenskab
Standarder	Syntaks : RDF RDF/XML Notation 3 Skildpadde N-tripler JSON-LD SPARQL URI HTTP XML Skemaer, ontologier : RDFS UGLE Regeludvekslingsformat Semantisk webregelsprog fælles logik Schema.org Semantisk anmærkning : RDFa eRDF GRDDL Mikroformater Mikrodata Ordbøger : DOAP FOAF SIOC Dublins kerne SKOS UMBEL Historie : Almindelig gammel semantisk HTML DAML+OLIE