Semantisk web

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 22. marts 2022; checks kræver 2 redigeringer .

Det semantiske netværk  er en informationsmodel af emneområdet , har form af en rettet graf . Grafens hjørner svarer til objekterne i emneområdet, og buerne (kanterne) definerer forholdet mellem dem. Objekter kan være: koncepter , hændelser , egenskaber, processer [1] . Således er det semantiske web en af ​​måderne at repræsentere viden på .

Navnet kombinerer termer fra to videnskaber: semantik i lingvistikstudier betydningen af ​​sprogenheder, og et netværk i matematik er en slags graf  - et sæt knudepunkter forbundet med buer (kanter), som er tildelt et bestemt nummer. I det semantiske netværk spilles nodernes rolle af videnbasens begreber , og buerne (i øvrigt rettet) definerer forholdet mellem dem. Det semantiske netværk afspejler således fagområdets semantik i form af begreber og relationer.

Det er forkert at sætte lighedstegn mellem begreberne "Semantic Network" ( eng.  Semantic Network ) og " Semantic Web " ( eng.  Semantic Web ). Selvom disse begreber ikke er ækvivalente, er de ikke desto mindre relaterede (se nedenfor ).

Historie

Ideen om systematisering på grundlag af enhver semantisk relation blev foreslået af videnskabsmænd fra tidlig videnskab. Carl Linnaeus' biologiske klassifikation fra 1735 er et eksempel på dette . Betragtet som et semantisk netværk bruger denne klassifikation en delmængderelation, moderne AKO (fra engelsk "A Kind Of", "variety").

Forfædre til moderne semantiske netværk kan betragtes som eksistentielle grafer foreslået af Charles Pierce i 1909 . De blev brugt til at repræsentere logiske udsagn i form af specielle diagrammer. Peirce kaldte denne metode "fremtidens logik."

En vigtig retning i studiet af netværk var den tyske psykolog Otto Selz' arbejde i 1913 og 1922. I dem brugte han grafer og semantiske relationer for at organisere strukturerne af begreber og associationer samt for at studere metoderne til nedarvning af egenskaber. Forskerne M. Anderson (1973), D. Norman (1975) og andre brugte disse værker til at modellere menneskelig hukommelse og intellektuelle egenskaber.

Computer Semantic Networks blev udviklet i detaljer af Richard Richens  i 1956 som en del af Cambridge Language Learning Centers maskinoversættelsesprojekt . Processen med maskinoversættelse er opdelt i 2 dele: oversættelse af kildeteksten til en mellemform for repræsentation, og derefter oversættes denne mellemform til det ønskede sprog. Semantiske netværk var netop sådan en mellemform. I 1961 dukkede Masterman op , hvor hun blandt andet definerede et grundlæggende ordforråd for 15.000 begreber. Disse undersøgelser blev videreført af Robert Simmons (1966), J. Wilkes (1972) og andre videnskabsmænd.  

Værker om semantiske netværk refererer ofte til den amerikanske psykolog Ross Quillians arbejde om " semantisk hukommelse " [2] .

Struktur

Matematik giver dig mulighed for at beskrive de fleste af fænomenerne i verden omkring dig i form af logiske udsagn. Semantiske netværk opstod som et forsøg på at visualisere matematiske formler. Hovedrepræsentationen for det semantiske web er grafen . Men glem ikke, at bag det grafiske billede er der bestemt en streng matematisk notation, og at begge disse former viser det samme.

Grafisk repræsentation

Den vigtigste form for repræsentation af det semantiske netværk er en graf. Begreberne i det semantiske netværk er skrevet i ovaler eller rektangler og er forbundet med pile med billedtekster - buer (se fig.). Dette er den mest bekvemme form, som en person opfatter. Dens mangler viser sig, når vi begynder at bygge mere komplekse netværk eller forsøger at tage højde for det naturlige sprogs egenskaber. Skemaer af semantiske netværk, hvorpå retningerne for navigationsrelationer er angivet, kaldes videnskort, og deres helhed, som gør det muligt at dække store dele af det semantiske netværk, kaldes et vidensatlas.

Matematisk notation

I matematik er en graf repræsenteret af et sæt toppunkter V og et sæt af relationer mellem dem E. Ved hjælp af matematisk logiks apparat konkluderer vi, at hvert toppunkt svarer til et element i objektmængden, og buen svarer til et prædikat .

Sproglig notation

I lingvistik optages relationer i ordbøger og synonymordbog . I ordbøger, i definitioner gennem slægt og specifik forskel, indtager det generiske begreb en bestemt plads. I tesauri, i artiklen af ​​hvert udtryk, kan alle mulige forbindelser med andre relaterede termer angives. Fra sådanne tesaurier er det nødvendigt at skelne informationssøgningstesauri med lister over søgeord i artikler, der er beregnet til drift af deskriptorsøgemaskiner.

Klassifikation af semantiske netværk

For alle semantiske netværk er opdelingen efter aritet og antallet af typer af relationer retfærdig.

Ud over konceptuelle grafer er der andre ændringer af semantiske netværk, dette er et andet grundlag for klassificering ( ved implementering ). Se det relevante afsnit nedenfor for flere detaljer .

Semantiske relationer

Antallet af typer relationer i det semantiske netværk bestemmes af dets skaber, baseret på specifikke mål. I den virkelige verden har deres antal en tendens til uendeligt. Hver relation er faktisk et prædikat, simpelt eller sammensat. Hurtigheden af ​​at arbejde med videnbasen afhænger af, hvor effektivt programmerne til behandling af de nødvendige relationer implementeres.

Hierarkisk

Oftest er der behov for at beskrive forholdet mellem elementer, mængder og dele af objekter. Forholdet mellem et objekt og et sæt, der angiver, at objektet tilhører dette sæt, kaldes en klassifikationsrelation ( ISA ). Et sæt (klasse) siges at klassificere sine forekomster . [3] (eksempel: "Ballon er en hund" = Ballon er et objekt af typen hund ). Nogle gange kaldes denne relation også MemberOf, InstanceOf eller lignende. ISA-kommunikation antager, at et objekts egenskaber nedarves fra et sæt. Det omvendte forhold til ISA bruges til at betegne eksempler, hvorfor det kaldes "Eksempel", eller på russisk "Eksempel". Hierarkiske relationer danner en træstruktur .

Ofte i semantiske netværk er det nødvendigt at definere forholdet mellem synonymi og antonymi . Disse forbindelser duplikeres enten eksplicit i selve netværket eller bestemmes af den algoritmiske komponent.

Hjælpe

I semantiske netværk bruges følgende relationer også ofte :

Denne liste kan fortsættes i det uendelige: i den virkelige verden er antallet af forhold enormt. For eksempel kan relationen "helt andre ting" eller lignende bruges mellem begreber: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).

Funktioner ved at bruge nogle typer relationer

I det semantiske netværk kan begreber både være instanser af objekter og deres sæt. Brug af de samme relationer for både elementer og samlinger kan føre til forvirring. Lignende fejl i driften af ​​nogle tidlige systemer blev beskrevet i Drew McDermottsArtificial Intelligence Faces Natural Stupidity

Lad os tage et kig på fire sætninger:

  1. Pavel har en far ved navn Alexei.
  2. For Paul er der en far fra mange mænd.
  3. Der er en person, for hvem Alexei er far.
  4. Hver person har en far til mange mænd.

For en person er betydningen af ​​disse sætninger klar, og mange ville uden tøven sige i alle fire tilfælde, at forholdet er far . Dette er dog en fejl: i det første tilfælde beskrives faktisk forholdet mellem to instanser, men i det andet og tredje - mellem et instans og et sæt, og i det fjerde - et forhold mellem repræsentanter fra to sæt. I matematisk notation ser det således ud for henholdsvis sætning 1-4:

I. ∃ pavel & ∃ alexey: far (alexey, paul); IIa. ∃ paul → ∃ x ∈ mænd : far(x, paul); IIb. ∃ alexey → ∃ y ∈ mennesker : far(alexey, y); III. ∀ y ∈ mennesker → ∃ x ∈ mænd : far(x, y);

Vi ser, at tilfælde IIa og IIb kun adskiller sig i rækkefølgen af ​​variablerne i prædikatet, men dette kan spille en vigtig rolle for netværkets korrekthed. I eksemplet er der kun angivet 4 typer relationer, men der er ni af dem for et binært netværk. De adskiller sig i kvantifikatorerne ∃ og ∀, samt rækkefølgen af ​​variablerne.

Grafisk, for at skelne mellem alle disse tilfælde, bruges specielle former for markeringsrelationer på grafen: For eksempel forbliver relationer af den første slags uændrede, den anden type er skitseret med en rektangulær ramme af prikker, den tredje er en bindestreg, og den fjerde er en streg-prik. Eller du kan bare skrive relationstypeindekset ved siden af.

Den mest almindelige forvirring opstår omkring ISA- relationen . Derfor er det i mange moderne værker accepteret, at ISA betegner forholdet mellem en instans og et sæt (ovenstående tilfælde IIb): Murka ISA kat . En enkelt ramme bruges ikke i dette tilfælde. Hvis det er påkrævet at definere en ækvivalensrelation (tilfælde I), kan der indføres en særlig relation til dette (selvom der for det semantiske web er ringe behov for det). ISA kan bruges til at angive forekomsten af ​​elementer fra et sæt i et andet (tilfælde III), men dette anbefales ikke. For at betegne delmængder bruges en anden speciel relation - AKO . Forskellen mellem ISA i en boks og AKO er, at sidstnævnte også er ansvarlig for at arve egenskaberne for selve sættene, og ikke kun elementerne.

Brug af semantiske netværk

Semantisering

Semantisering er processen med at ændre tekster, hvor der skelnes mellem semantiske relationer uden at ændre deres indhold. Wikipedia har projekter til at semantisere artikler og kategoritræet.

Det semantiske web

Begrebet hypertekstorganisation ligner et homogent binært semantisk netværk, men der er en væsentlig forskel:

  1. Forbindelsen lavet af et hyperlink har ingen semantik, det vil sige, den beskriver ikke betydningen af ​​denne forbindelse. Formålet med det semantiske netværk er at beskrive forholdet mellem objekter og ikke yderligere information om emneområdet. En person kan finde ud af, hvorfor dette eller hint hyperlink er nødvendigt, men denne forbindelse er ikke klar for computeren.
  2. Hyperlinkede sider er dokumenter , der som regel beskriver problemsituationen som helhed. I et semantisk web repræsenterer hjørner (hvilke relationer forbinder) begreber eller objekter fra den virkelige verden .

Et forsøg på at skabe et semantisk web baseret på World Wide Web er blevet kaldt Semantic Web . Dette koncept involverer brugen af ​​RDF (et XML-baseret markup- sprog ) og har til formål at give links en betydning, som computersystemer kan forstå. Dette vil gøre internettet til en distribueret videnbase på globalt plan.

Software

Se også

Noter

  1. Roussopoulos ND En semantisk netværksmodel af databaser.  - TR No 104, Institut for Computer Science, University of Toronto, 1976.
  2. Quillian, M. R. (1968). semantisk hukommelse. Semantisk informationsbehandling, 227-270.
  3. Grundlæggende begreber . Hentet 15. april 2007. Arkiveret fra originalen 25. januar 2007.