Semantisk web (fra engelsk semantisk web ) - et offentligt globalt semantisk netværk , dannet på basis af World Wide Web ved at standardisere præsentationen af information i en form, der er egnet til maskinbehandling.
I et konventionelt HTML -baseret World Wide Web er information indlejret i teksten på siderne og er beregnet til at blive læst og forstået af mennesker. Det semantiske web består af maskinlæsbare elementer - det semantiske webs noder , baseret på ontologi . Takket være dette er klientprogrammer i stand til direkte at modtage udsagn i formen "emne-type forhold - et andet objekt" fra internettet og beregne logiske konklusioner på dem . Det semantiske web fungerer parallelt med og oven på det almindelige World Wide Web ved hjælp af HTTP-protokollen og URI - ressourceidentifikatorer .
Navnet "Semantic Web" blev først introduceret af Tim Berners-Lee (opfinderen af World Wide Web) i september 1998 [1] , og han kalder det "det næste skridt i udviklingen af World Wide Web". Senere i sin blog foreslog han [2] som et synonym for udtrykket "giant global graph" ( eng. giant global graph , GGG , analogt med WWW). Begrebet Semantic Web er blevet vedtaget og fremmes af World Wide Web Consortium [3] .
The Semantic Web er en tilføjelse til det eksisterende World Wide Web designet til at gøre information, der er lagt på internettet, egnet til maskinbehandling. Den information, der er tilgængelig på nettet, kan læses af mennesker. Det Semantiske Web er designet til at gøre information egnet til automatisk analyse, syntese af konklusioner og transformation af både selve dataene og konklusionerne fra dem til forskellige repræsentationer, der er nyttige i praksis.
Maskinbearbejdning er mulig på grund af to karakteristika Semantic Web:
URI er en ensartet ressource-id eller adresse , der bruges til at angive links til et eller andet objekt (f.eks. en webside , fil eller e -mail -boks). URI'er bruges til at navngive objekter. Hvert objekt i det globale semantiske netværk har en unik URI. En URI navngiver et objekt entydigt. Separate URI'er oprettes ikke kun til sider, men også til objekter i den virkelige verden (mennesker, byer, kunstværker og så videre) og endda til abstrakte begreber (f.eks. "navn", "position", "farve" ). På grund af det unikke ved URI'er kan de samme elementer navngives det samme forskellige steder på det semantiske web. Ved at bruge en URI kan du indsamle oplysninger om den samme vare fra forskellige steder. Det anbefales at inkludere navnet på en af World Wide Web-protokollerne ( HTTP eller HTTPS ) i URI-adressen. Det vil sige, at URI-adressen anbefales at starte med "http://" eller "https://"). En sådan adresse kan bruges både som en URI -adresse og som en websideadresse ( URL ). På websider, hvis URL'er matcher URI'er, anbefaler W3C, at du inkluderer en beskrivelse af varen. Det er ønskeligt at give en beskrivelse i to formater [5] :
Brug af semantiske netværk og ontologier . Data på World Wide Web præsenteres normalt som tekst skrevet på naturlige sprog . Sådanne tekster er designet til at være læselige af mennesker, men en maskine kan forstå deres betydning ved hjælp af en af de naturlige sprogbehandlingsteknikker . Metoderne udfører frekvensanalyse og/eller leksikalsk analyse af teksten.
W3C foreslår at bruge RDF - sproget som et maskinlæsbart format . RDF-sproget giver dig mulighed for at beskrive strukturen af det semantiske netværk i form af en graf . Hver knude og hver bue i grafen kan tildeles en separat URI. Udsagn skrevet i RDF kan fortolkes ved hjælp af ontologier. For at skabe ontologier anbefales det at bruge RDF-skemaet (engelsk) og OWL -sprogene . Ontologier er skabt for at drage logiske konklusioner ud fra data . Ontologier er baseret på matematiske formalismer kaldet beskrivelseslogikker .
Den tekniske del af Semantic Web er en familie af standarder for beskrivelsessprog, herunder XML , XML Schema , RDF , RDF Schema , OWL og nogle andre. Ved at arrangere dem i rækkefølge for at øge abstraktionsniveauet implementeret af et bestemt sprog, får vi:
Formaterne til beskrivelse af metadata i Semantic Web involverer at drage en logisk konklusion på disse metadata, og er udviklet med henblik på de eksisterende matematiske formalismer på dette område. Formalismen bag formatet gør det muligt at drage konklusioner om egenskaberne ved programmer, der behandler data i dette format.
Dette gælder især for OWL -sproget . Den grundlæggende formalisme for det er beskrivelseslogikker , og selve sproget er opdelt i tre indlejrede delmængder (i rækkefølge efter indlejring): OWL Lite, OWL DL og OWL Full [6] . Det er blevet bevist [7] at inferens på metadata med OWL Lite ekspressivitet udføres i polynomisk tid (med andre ord hører inferensproblemet til klasse P ). OWL DL beskriver den største opløselige delmængde af beskrivelseslogikker, men nogle forespørgsler om sådanne data kan kræve eksponentiel eksekveringstid . OWL Full implementerer alle eksisterende beskrivelseslogik-konstruktører ved at fjerne den obligatoriske opløselighed af forespørgsler.
Den simple prædikatstruktur i RDF -sproget giver dig til gengæld mulighed for at bruge erfaring fra logiske databaseteorier , prædikatlogik osv. i dets behandling.
I 2006 udgav tidsskriftet IEEE Intelligent Systems en ny artikel af Tim Berners-Lee, "Semantic Web Revisited" (Semantic Web: Revisited) [8] , hvori forfatteren kalder den beskrevne tilgang til organisering af information på nettet for "en simpel idé, indtil nu stort set uudnyttet indtil nu,” på trods af alle de fordele, som det semantiske web ville give, hvis det blev implementeret.
Til dato er der ingen offentligt tilgængelige midler til at se og direkte bruge oplysningerne fra websteder på Semantic Web. Sjældne prøver er spredt, og klientprogrammer går ikke ud over niveauet for lokale forskningsprojekter af individuelle entusiaster.
Kommentatorer peger på forskellige årsager, der hindrer den aktive udvikling af det semantiske web, lige fra den menneskelige faktor [9] (folk har en tendens til at undgå arbejdet med at vedligeholde dokumenter med metadata, metadata sandhedsproblemer forbliver åbne osv.), og slutter med Aristoteles 's indirekte reference til fraværet af en åbenlys måde at opdele verden i skelnelige begreber. Dette sår tvivl om muligheden for en ontologi på topniveau , der er kritisk for det semantiske web. Aristoteles i Topeka bruger begrebet differentia specifica , eller tilstedeværelsen af en karakteristisk kvalitet i begreber , som grundlag for at gruppere begreber i klasser. Filosoffen er sikker på eksistensen af et uendeligt antal begreber, hvilket indebærer en uendelighed af antallet af klasser, som de kan kombineres i. For at udskille så mange klasser er der brug for et uendeligt antal skelnelige kvaliteter, hvis eksistens Aristoteles sætter spørgsmålstegn ved.
Behovet for at beskrive metadata fører på en eller anden måde til duplikering af information. Hvert dokument skal oprettes i to kopier: markeret til menneskelig læsning og også i et maskinorienteret format. Denne mangel ved det semantiske web var den vigtigste drivkraft for skabelsen af såkaldte mikroformater [10] og RDF -sproget [11] . Sidstnævnte er en variant af RDF -sproget og adskiller sig fra det ved, at det ikke definerer sin egen syntaks, men er beregnet til at blive indlejret i XHTML - sidernes XML-attributter. Derudover vises semantiske tags i selve HTML-standarderne .
Et af de første seriøse og populære projekter baseret på principperne fra det semantiske web var Dublin Core - projektet , implementeret af Dublin Core Metadata Initiative (DCMI) . Det er et åbent projekt, der har til formål at udvikle metadatastandarder, der er platformsuafhængige og velegnede til en lang række applikationer. Mere specifikt udvikler DCMI metadataordbøger til generelle formål, der standardiserer RDF-ressourcebeskrivelser. [femten]
Versioner 0.90 og 1.0 af RSS -formatet er baseret på RDF. Oplysninger i den er repræsenteret, som i RDF, ved subjekt-relation-objekt tripler . Det skal bemærkes, at selvom det lider under mange af manglerne ved det semantiske web (såsom kopiering af information), blev dette simple format hurtigt ekstremt populært på grund af den snævre kategorisering af den anvendte undergruppe af metadata. Forskellen mellem RSS og RDF er, at emnet for triplen altid er RSS-filens kildested, og de mest åbenlyse egenskaber ved dokumenter relateret til hyppigt opdaterede informationskilder bruges som relationer: skrivedato, forfatter, permalink, osv. Med andre ord er RSS en højt specialiseret undergruppe af RDF. [16]
Bemærk, at RSS-version 2.0-formatet, selvom det ikke er et RDF-baseret format, tillader indsprøjtning af vilkårligt XML-indhold i native XML - navnerum . Dette gør det muligt også at bruge RDF-beskrivelser i den (ved at bruge navneområdet rdf). [17]
Projektet " Ven af en ven " giver dig mulighed for at beskrive bekendtskabsforholdet ved hjælp af RDF. Ethvert medlem kan entydigt identificere sig selv med en URI (f.eks. mailto -e-mailadresse , blogadresse osv.), oprette deres profil ved hjælp af de foruddefinerede RDF-relationer for FOAF og angive ID'erne på de personer, som denne deltager kender. Denne beskrivelse kan behandles automatisk; baseret på det kan du opbygge tillidsnetværk, analysere strukturen af sociale grupper osv. [18]
DBpedia er et projekt, der har til formål at udtrække struktureret information fra data skabt af Wikipedia-projektet. DBpedia giver brugerne mulighed for at forespørge efter oplysninger baseret på relationerne og egenskaberne for Wikipedia-ressourcer, herunder links til relaterede databaser. Startet af en gruppe frivillige fra det frie universitet i Berlin og universitetet i Leipzig , i samarbejde med OpenLink Software , og blev først udgivet i 2007. DBpedia-projektet bruger RDF ( Resource Description Framework ) til at repræsentere udvundet information. Fra april 2010 består DBpedias databaser af over 1 milliard elementer af information, hvoraf 257 millioner blev hentet fra den engelske version af Wikipedia og 766 millioner blev udtrukket fra versioner på andre sprog [19] .
Web og hjemmesider | |
---|---|
globalt | |
Lokalt | |
Typer af websteder og tjenester |
|
Oprettelse og vedligeholdelse | |
Typer af layout, sider, websteder | |
Teknisk | |
Markedsføring | |
Samfund og kultur |
semantisk web | |
---|---|
Grundlæggende | |
Underafsnit |
|
Ansøgninger |
|
relaterede emner | |
Standarder |
|