Cyc

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 26. august 2018; checks kræver 12 redigeringer .
Cyc
Type vidensbase , inferensmotor , computerprogram , højere ontologi og forskningsprojekt [d]
Udvikler Lenat, Douglas
Skrevet i Lisp , Cycle [d] og SubL [d]
Første udgave 1984
Internet side cykl.com

Cyc ( skrevet på latin, udtales Cyc ) er et projekt, der skal skabe en omfangsrig ontologisk vidensbase, der gør det muligt for programmer at løse komplekse problemer fra området for kunstig intelligens baseret på logisk slutning og brug af sund fornuft .

Oversigt

Projektet blev startet af Douglas Lenat i 1984 hos Microelectronics and Computer Technology Corporation . Navnet "Cyc" (afledt af det engelske  leksikon : "cyc") er et registreret varemærke tilhørende Cycorp, Inc i Austin , drevet af Lenat og skabt til at udvikle Cyc. Videnbasen er virksomhedens ejendom, men en lille del af basen, beregnet til at etablere et fælles ordforråd for automatiske ræsonnementprogrammer, blev udgivet som OpenCyc under en åben licens. Cyc blev senere stillet til rådighed for AI-forskere under en særlig forskningslicens fra ResearchCyc .

Typiske eksempler på viden i databasen er: "Hvert træ er en plante" og "Planter er dødelige". Hvis du spørger "dør træer?", kan inferensmotoren drage den indlysende konklusion og give det rigtige svar. Knowledge Base ( Engelsk  Knowledge Base eller KB) indeholder mere end en million udsagn, regler og almindeligt brugte ideer, som folk har indtastet der. De er formuleret i CycL -sproget , som er baseret på prædikatregning og har en Lisp- lignende syntaks . Engelsktalende brugere joker med, at de er "cyklister" (fra den engelske  cyklist  - en cyklist).

Det meste af dagens arbejde i Cyc-projektet handler stadig om vidensteknologi  – manuel beskrivelse af fakta om verden omkring os og implementering af effektive inferensmekanismer baseret på denne viden. Der arbejdes dog på at sætte Cyc-systemet i stand til at kommunikere uafhængigt med brugere i naturligt sprog og for at fremskynde processen med at genopbygge basen ved hjælp af maskinlæring .

Beskrivelse af videnbasen, terminologi

Begreber i Cyc kaldes konstanter . Konstantnavne begynder med de valgfri "#$"-tegn og skelner mellem store og små bogstaver. Der er konstanter for:

De vigtigste prædikater er #$isa og #$genls. Den første er en erklæring om, at et element er en instans af en samling, og den anden er, at en samling er en undersamling af en anden samling. Fakta om begreber erklæres ved hjælp af specielle CycL-udsagn . Prædikater er skrevet i parentes før deres argumenter:

(#$isa #$BillClinton #$UnitedStates President)

betyder, at "Bill Clinton er en af ​​USA's præsidenter", og udtalelsen

(#$genls #$Tree-ThePlant #$Plant)

lyder "Alle træer er planter."

(#$capitalCity #$Frankrig #$Paris)

betyder "Paris er Frankrigs hovedstad".

Udsagn kan også indeholde variable, linjer der begynder med et "?". Disse udsagn kaldes "regler". En af de vigtigste regler vedrørende #$isa-prædikatet lyder:

(#$antyder (#$og (#$isa ?OBJ ?SUBSET) (#$genls ?SUBSET ?SUPERSET)) (#$isa ?OBJ ?SUPERSET))

hvilket betyder "hvis OBJ er en forekomst af SUBSET- samlingen , og SUBSET igen er en undersamling af SUPERSET, så er OBJ også en forekomst af SUPERSET-samlingen." Et andet typisk eksempel:

(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)

hvilket betyder, at enhver forekomst af #$ChordataPhylum-samlingen (det vil sige enhver chordate ) er forbundet med et hundyr (en forekomst af #$FemaleAnimal), der er dets mor (som beskrevet af #$BiologicalMother-prædikatet).

Cyc vidensbasen er opdelt i mikroteorier (Mt), samlinger af begreber og fakta, der hører til ét specifikt vidensområde. I modsætning til en komplet videnbase skal enhver mikroteori være fri for modsigelser. Hver mikroteori har et navn, som er en almindelig konstant; efter konvention indeholder mikroteorikonstanter strengen "Mt". Et eksempel er #$MathMt, en mikroteori, der indeholder matematisk viden. Mikroteorier kan nedarves fra hinanden og er organiseret i et hierarki: en af ​​specialiseringerne i #$MathMt er #$GeometryGMt - en mikroteori om geometri.

openencyc

Den seneste version af OpenCyc, 1.0, blev udgivet i juli 2006. OpenCyc 1.0 inkluderer en komplet Cyc-ontologi, der indeholder hundredtusindvis af udtryk, millioner af udsagn, der forbinder termer med hinanden. Videnbasen indeholder 47.000 begreber og 306.000 fakta og kan ses på OpenCycs hjemmeside. Den første version af OpenCyc blev udgivet i maj 2001 med kun 6.000 koncepter og 60.000 fakta. Videnbasen er udgivet under Apache -licensen . Cycorp har til hensigt at frigive OpenCyc under parallelle, mindre restriktive licenser for at imødekomme brugernes behov. CycL- og SubL- fortolkeren (et program, der giver dig mulighed for at se og ændre databasen og drage konklusioner) udgives gratis, men kun i binær form uden kildekode. Det kører både under GNU/Linux og Microsoft Windows .

ResearchCyc

I juli 2006 udgav Cycorp ResearchCyc 1.0, en gratis (men lukket kildekode) version af Cyc rettet mod forskersamfundet. (ResearchCyc var i beta gennem hele 2004, og blev frigivet til beta-test i februar 2005.) Udover taksonomiske oplysninger fra OpenCyc indeholder ResearchCyc væsentlig mere semantisk viden (det vil sige yderligere fakta) om begreberne i sin vidensbase, og omfatter bl.a. et stort leksikon, værktøjer til at analysere og generere engelsk , skrevet i Java -grænseflader til redigering af viden og oprettelse af forespørgsler til databasen.

Cycorp har offentligt udtrykt sin hensigt om at frigive alle vilkår og taksonomiske relationer indeholdt i ResearchCyc som en del af OpenCyc, og dette er blevet gjort i version 1.0. Et af de erklærede mål er at skabe et helt gratis og ubegrænset semantisk ordforråd til brug på det semantiske web . OpenCyc-taksonomien er tilgængelig i Owl -format fra OpenCyc-projektets hjemmeside.

Kritik af Cyc-projektet

Cyc er blevet beskrevet som "en af ​​de mest kontroversielle bestræbelser i historien om kunstig intelligens" (Bertino et al. s. 275), så den har uundgåeligt modtaget sin rimelige andel af kritik.

Disse spørgsmål er blevet diskuteret forskellige steder siden lanceringen af ​​projektet. Doug Lenat og andre har offentliggjort mange argumenter til forsvar for deres projekt.

Se også

Bibliografi

Noter

  1. Volkel M., Krotzsch M., Vrandecic D., Haller H., Studer R. Semantisk Wikipedia Arkiveret 31. december 2019 på Wayback Machine . I Proceedings of the 15th International Conference on the World Wide Web. WWW '06. ACM Press, New York, NY. Edinburgh, Skotland, 23.-26. maj 2006. - s. 585-594

Links