Cyc
Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den
version , der blev gennemgået den 26. august 2018; checks kræver
12 redigeringer .
Cyc ( skrevet på latin, udtales Cyc ) er et projekt, der skal skabe en omfangsrig ontologisk vidensbase, der gør det muligt for programmer at løse komplekse problemer fra området for kunstig intelligens baseret på logisk slutning og brug af sund fornuft .
Oversigt
Projektet blev startet af Douglas Lenat i 1984 hos Microelectronics and Computer Technology Corporation . Navnet "Cyc" (afledt af det engelske leksikon : "cyc") er et registreret varemærke tilhørende Cycorp, Inc i Austin , drevet af Lenat og skabt til at udvikle Cyc. Videnbasen er virksomhedens ejendom, men en lille del af basen, beregnet til at etablere et fælles ordforråd for automatiske ræsonnementprogrammer, blev udgivet som OpenCyc under en åben licens. Cyc blev senere stillet til rådighed for AI-forskere under en særlig forskningslicens fra ResearchCyc .
Typiske eksempler på viden i databasen er: "Hvert træ er en plante" og "Planter er dødelige". Hvis du spørger "dør træer?", kan inferensmotoren drage den indlysende konklusion og give det rigtige svar. Knowledge Base ( Engelsk Knowledge Base eller KB) indeholder mere end en million udsagn, regler og almindeligt brugte ideer, som folk har indtastet der. De er formuleret i CycL -sproget , som er baseret på prædikatregning og har en Lisp- lignende syntaks . Engelsktalende brugere joker med, at de er "cyklister" (fra den engelske cyklist - en cyklist).
Det meste af dagens arbejde i Cyc-projektet handler stadig om vidensteknologi – manuel beskrivelse af fakta om verden omkring os og implementering af effektive inferensmekanismer baseret på denne viden. Der arbejdes dog på at sætte Cyc-systemet i stand til at kommunikere uafhængigt med brugere i naturligt sprog og for at fremskynde processen med at genopbygge basen ved hjælp af maskinlæring .
Beskrivelse af videnbasen, terminologi
Begreber i Cyc kaldes konstanter . Konstantnavne begynder med de valgfri "#$"-tegn og skelner mellem store og små bogstaver. Der er konstanter for:
- individuelle elementer kaldet individual , såsom #$BillClinton eller #$France.
- samlinger ( Collections ) såsom #$Tree-ThePlant (som indeholder alle træer) eller #$EquivalenceRelation (som indeholder alle ækvivalensrelationer ). Et medlem af en samling kaldes en instans af denne samling.
- Sandhedsfunktioner , der kan anvendes på et eller flere begreber og returnerer sandt eller falsk . For eksempel er #$søskende et søskendeforhold, der kun er sandt, hvis to af dets argumenter er søskende. Efter konvention begynder sandhedsfunktionskonstanter med et lille bogstav. Sandhedsfunktioner kan opdeles i logiske forbindelser (såsom #$and, #$or, #$not, #$implies), kvantifiers (#$forAlle, #$thereExists osv.) og prædikater .
- Funktioner , som danner nye termer fra dataene. For eksempel, hvis du sender en type (eller samling) af planter som et argument til #$FruitFn-funktionen, vil den returnere en samling af deres frugter. Efter konvention begynder funktionskonstanters navne med et stort bogstav og slutter med strengen "Fn".
De vigtigste prædikater er #$isa og #$genls. Den første er en erklæring om, at et element er en instans af en samling, og den anden er, at en samling er en undersamling af en anden samling. Fakta om begreber erklæres ved hjælp af specielle CycL-udsagn . Prædikater er skrevet i parentes før deres argumenter:
(#$isa #$BillClinton #$UnitedStates President)
betyder, at "Bill Clinton er en af USA's præsidenter", og udtalelsen
(#$genls #$Tree-ThePlant #$Plant)
lyder "Alle træer er planter."
(#$capitalCity #$Frankrig #$Paris)
betyder "Paris er Frankrigs hovedstad".
Udsagn kan også indeholde variable, linjer der begynder med et "?". Disse udsagn kaldes "regler". En af de vigtigste regler vedrørende #$isa-prædikatet lyder:
(#$antyder
(#$og
(#$isa ?OBJ ?SUBSET)
(#$genls ?SUBSET ?SUPERSET))
(#$isa ?OBJ ?SUPERSET))
hvilket betyder "hvis OBJ er en forekomst af SUBSET- samlingen , og SUBSET igen er en undersamling af SUPERSET, så er OBJ også en forekomst af SUPERSET-samlingen." Et andet typisk eksempel:
(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)
hvilket betyder, at enhver forekomst af #$ChordataPhylum-samlingen (det vil sige enhver chordate ) er forbundet med et hundyr (en forekomst af #$FemaleAnimal), der er dets mor (som beskrevet af #$BiologicalMother-prædikatet).
Cyc vidensbasen er opdelt i mikroteorier (Mt), samlinger af begreber og fakta, der hører til ét specifikt vidensområde. I modsætning til en komplet videnbase skal enhver mikroteori være fri for modsigelser. Hver mikroteori har et navn, som er en almindelig konstant; efter konvention indeholder mikroteorikonstanter strengen "Mt". Et eksempel er #$MathMt, en mikroteori, der indeholder matematisk viden. Mikroteorier kan nedarves fra hinanden og er organiseret i et hierarki: en af specialiseringerne i #$MathMt er #$GeometryGMt - en mikroteori om geometri.
openencyc
Den seneste version af OpenCyc, 1.0, blev udgivet i juli 2006. OpenCyc 1.0 inkluderer en komplet Cyc-ontologi, der indeholder hundredtusindvis af udtryk, millioner af udsagn, der forbinder termer med hinanden. Videnbasen indeholder 47.000 begreber og 306.000 fakta og kan ses på OpenCycs hjemmeside. Den første version af OpenCyc blev udgivet i maj 2001 med kun 6.000 koncepter og 60.000 fakta. Videnbasen er udgivet under Apache -licensen . Cycorp har til hensigt at frigive OpenCyc under parallelle, mindre restriktive licenser for at imødekomme brugernes behov. CycL- og SubL- fortolkeren (et program, der giver dig mulighed for at se og ændre databasen og drage konklusioner) udgives gratis, men kun i binær form uden kildekode. Det kører både under GNU/Linux og Microsoft Windows .
ResearchCyc
I juli 2006 udgav Cycorp ResearchCyc 1.0, en gratis (men lukket kildekode) version af Cyc rettet mod forskersamfundet. (ResearchCyc var i beta gennem hele 2004, og blev frigivet til beta-test i februar 2005.) Udover taksonomiske oplysninger fra OpenCyc indeholder ResearchCyc væsentlig mere semantisk viden (det vil sige yderligere fakta) om begreberne i sin vidensbase, og omfatter bl.a. et stort leksikon, værktøjer til at analysere og generere engelsk , skrevet i Java -grænseflader til redigering af viden og oprettelse af forespørgsler til databasen.
Cycorp har offentligt udtrykt sin hensigt om at frigive alle vilkår og taksonomiske relationer indeholdt i ResearchCyc som en del af OpenCyc, og dette er blevet gjort i version 1.0. Et af de erklærede mål er at skabe et helt gratis og ubegrænset semantisk ordforråd til brug på det semantiske web . OpenCyc-taksonomien er tilgængelig i Owl -format fra OpenCyc-projektets hjemmeside.
Kritik af Cyc-projektet
Cyc er blevet beskrevet som "en af de mest kontroversielle bestræbelser i historien om kunstig intelligens" (Bertino et al. s. 275), så den har uundgåeligt modtaget sin rimelige andel af kritik.
- Systemets overdreven kompleksitet - uden tvivl nødvendig på grund af encyklopædiske ambitioner - og følgelig kompleksiteten i at tilføje (manuelt) data til systemet;
- Skalerbarhedsproblemer fra udbredt tingsliggørelse, især som konstanter;
- Den utilfredsstillende brug af stofbegrebet og den relaterede sondring mellem iboende og ydre egenskaber;
- Mangel på fornuftige præstationsmålinger eller sammenligninger af effektiviteten af Cyc-inferensmotoren;
- Systemets nuværende ufuldstændighed i både bredden og dybden, og den dermed forbundne vanskelighed med at måle dets fuldstændighed;
- Manglende dokumentation;
- Manglen på opdateret online undervisningsmateriale gør det svært for nytilkomne at lære systemet at kende;
- På trods af dets navn er OpenCyc-systemet ikke helt åbent: data kan redigeres af brugere, men koden kan ikke udvides af udviklere. [en]
Disse spørgsmål er blevet diskuteret forskellige steder siden lanceringen af projektet. Doug Lenat og andre har offentliggjort mange argumenter til forsvar for deres projekt.
Se også
Bibliografi
- Elisa Bertino, Gian Piero Zarri, Barbara Catania, Gian Pierro Zarri. Intelligente databasesystemer (neopr.) . — Addison-Wesley Professional , 2001.
- Matuszek, Cynthia, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah og D. Lenat . Søgning efter sund fornuft: Befolkning af cyklus fra internettet . I Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh, Pennsylvania, juli 2005. [1]
- Shepard, Blake, C. Matuszek, C.B. Fraser, W. Wechtenhiser, D. Crabbe, Z. Gungordu, J. Jantos, T. Hughes, L. Lefkowitz, M. Witbrock, D. Lenat, E. Larson. En vidensbaseret tilgang til netværkssikkerhed: Anvendelse af Cyc i domænet for netværksrisikovurdering . I Proceedings of the Seventeenth Innovative Applications of Artificial Intelligence Conference, Pittsburgh, Pennsylvania, juli 2005. [2]
- Ramachandran, Deepak, P. Reagan, K. Goolsbey. First-Orderized ResearchCyc: Expressivity and Efficiency in a Common-Sense Ontology . I papirer fra AAAI Workshop om kontekster og ontologier: teori, praksis og anvendelser. Pittsburgh, Pennsylvania, juli 2005. [3]
- Cabral, John, R. C. Kahlert, C. Matuszek, M. Witbrock, B. Summers. Konvertering af semantisk meta-viden til induktiv bias . I Proceedings of the 15th International Conference on Inductive Logic Programming, Bonn, Tyskland, august 2005. [4]
- Schneider, Dave, C. Matuszek, P. Shah, R. Kahlert, D. Baxter, J. Cabral, M. Witbrock, D. Lenat. Indsamling og håndtering af fakta til intelligensanalyse . I Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, maj 2005. [5]
- Forbus, Kenneth, L. Birnbaum, E. Wagner, J. Baker & M. Witbrock . Kombination af analogi, intelligent informationssøgning og videnintegration til analyse: En foreløbig rapport . I Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, maj 2005. [6]
- Deaton, Chris, B. Shepard, C. Klein, C. Mayans, B. Summers, A. Brusseau, M. Witbrock . The Comprehensive Terrorism Knowledge Base in Cyc. I Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, maj 2005. [7]
- Rode, Benjamin. Mod en model for mønstergendannelse i relationelle data . I Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, maj 2005. [8]
- Siegel, Nick, B. Shepard, J. Cabral, M. Witbrock. Hypotesegenerering og evidenssamling til intelligensanalyse: Cycorps Nooscape-applikation . I Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, maj 2005. [9]
- Curtis, Jon, G. Matthews, D. Baxter. On the Effective Use of Cyc in a Question Answering System in Papers fra IJCAI Workshop on Knowledge and Reasoning for Answering Questions, Edinburgh, Skotland: 2005. [10]
- Witbrock, Michael, C. Matuszek, A. Brusseau, R. C. Kahlert, C. B. Fraser, D. Lenat. Knowledge Begets Knowledge: Steps into Assisted Knowledge Acquisition in Cyc in Papers fra 2005 AAAI Spring Symposium on Knowledge Collection from Volunteer Contributors (KCVC), pp. 99-105. Stanford, Californien, marts 2005. [11]
- Belasco, Alan, J. Curtis, R.C. Kahlert, C. Klein, C. Mayans, R. Reagan. Effektiv repræsentation af videnshuller . I D. Karagiannis, U. Reimer (red.): Practical Aspects of Knowledge Management, Proceedings of PAKM 2004, Wien, Østrig, 2.-3. december 2004, Springer-Verlag, Berlin Heidelberg. [12]
- Siegel, Nick, G. Matthews, J. Masters, R. Kahlert, M. Witbrock og K. Pittman. Agentarkitekturer: Kombination af styrkerne ved softwareteknologi og kognitive systemer i papirer fra AAAI Workshop om intelligente agentarkitekturer: Kombination af styrkerne ved softwareteknologi og kognitive systemer, teknisk rapport WS-04-07, s. 74-79. Menlo Park, Californien: AAAI Press, 2004. [13]
- Witbrock, Michael, K. Panton, S. L. Reed, D. Schneider, B. Aldag, M. Reimers og S. Bertolo. Automatiseret OWL-annotering Assisteret af en stor vidensbase i workshopnoter fra 2004-workshoppen om videnmarkering og semantisk annotering ved den 3. internationale semantiske webkonference ISWC2004, Hiroshima, Japan, november 2004, s. 71-80. [fjorten]
- Masters, James og Z. Gungordu. Struktureret videnkildeintegration: En statusrapport . Integration of Knowledge Intensive Multiagent Systems, Cambridge, Massachusetts, USA, 2003. [15]
- O'Hara, Tom, N. Salay, M. Witbrock, et al. Inducerende kriterier for leksikalske tilknytninger af massenavne ved hjælp af Cyc Knowledge Base og dens udvidelse til WordNet . I Proceedings of the Fifth International Workshop on Computational Semantics, Tilburg, 2003. [16]
- Witbrock, Michael, D. Baxter, J. Curtis, et al. Et interaktivt dialogsystem til videnindhentning i cyklus . I Proceedings of the Attende International Joint Conference on Artificial Intelligence, Acapulco, Mexico, 2003. [17]
- Panton, Kathy, P. Miraglia, N. Salay, et al. Vidensdannelse og dialog ved hjælp af KRAKEN-værktøjssættet . I Attende National Conference on Artificial Intelligence, Edmonton, Canada, 2002. [18]
- Mestre, James. Struktureret videnkildeintegration og dens anvendelser til informationsfusion . I Proceedings of the Fifth International Conference on Information Fusion, Annapolis, MD, juli 2002. [19]
- Reed, Stephen og D. Lenat. Kortlægning af ontologier i Cyc . I AAAI 2002 Conference Workshop on Ontologies For The Semantic Web, Edmonton, Canada, juli 2002. [20]
- D. Lenat og R.V. Guha. Opbygning af store vidensbaserede systemer: Repræsentation og slutning i Cyc- projektet . - Addison-Wesley , 1990.
- Den fiktive tænkemaskine SAL 9000 refererer eksplicit til en encyklopædisk database for at forstå, hvorfor dens skaber brugte navnet "Phoenix" til en diagnostisk simulering, der ville hjælpe med at genstarte dens tvillingeenhed, HAL 9000 , i 2001 - sagaen .
- Den fiktive tænkemaskine KARR (Knight Rider) tilgår eksplicit en database under en test af grundlæggende menneskelige ønsker (afsnit "Trust ruster ikke").
Noter
- ↑ Volkel M., Krotzsch M., Vrandecic D., Haller H., Studer R. Semantisk Wikipedia Arkiveret 31. december 2019 på Wayback Machine . I Proceedings of the 15th International Conference on the World Wide Web. WWW '06. ACM Press, New York, NY. Edinburgh, Skotland, 23.-26. maj 2006. - s. 585-594
Links
Ordbøger og encyklopædier |
|
---|