At lære med en lærer

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 12. april 2020; verifikation kræver 1 redigering .

Overvåget læring er en af ​​metoderne til maskinlæring  , hvor det testede system tvinges til at lære ved hjælp af eksempler på stimulus-respons. Fra et kybernetisk synspunkt er det en af ​​typerne af kybernetiske eksperimenter . Der kan være en vis sammenhæng mellem input og referenceoutput (stimulus-respons), men dette er ukendt. Kun et begrænset sæt præcedenser  er kendt - "stimulus-respons"-par, kaldet træningsprøven. Baseret på disse data er det nødvendigt at genoprette afhængigheden (at bygge en model af stimulus-respons-forhold, der er egnet til prognoser), det vil sige at bygge en algoritme, der er i stand til at give et ret præcist svar for ethvert objekt. For at måle nøjagtigheden af ​​svar, såvel som for at lære ved eksempler , kan en kvalitetsfunktion indføres .

Princippet for opsætning af dette eksperiment

Dette eksperiment er et specialtilfælde af et kybernetisk eksperiment med feedback. Opsætning af dette eksperiment forudsætter eksistensen af ​​et eksperimentelt system, en træningsmetode og en metode til at teste systemet eller måle egenskaber.

Det eksperimentelle system består igen af ​​det testede (brugte) system, rummet af stimuli modtaget fra det ydre miljø og forstærkningskontrolsystemet (regulator af interne parametre). Som et forstærkningskontrolsystem kan der bruges en automatisk kontrolenhed (for eksempel en termostat) eller en menneskelig operatør (lærer), der er i stand til at reagere på reaktionerne fra det testede system og miljøstimuli ved at anvende specielle forstærkningsregler, der ændrer tilstanden af systemets hukommelse.

Der er to muligheder: (1) når responsen fra det testede system ikke ændrer miljøets tilstand, og (2) når systemets respons ændrer miljøets stimuli. Disse skemaer indikerer den grundlæggende lighed mellem et sådant generelt system med det biologiske nervesystem.

Typologi af overvågede læringsopgaver

Input datatyper

Svartyper

Degenererede typer af forstærkningskontrolsystemer ("lærere")

Denne sondring giver mulighed for et dybere blik på forskellene mellem forskellige måder at lære på, da grænsen mellem superviseret og uovervåget læring er mere subtil. Derudover gjorde en sådan forskel det muligt at vise visse begrænsninger for kunstige neurale netværk for S- og R-kontrollerede systemer (se Perceptron Convergence Theorem ).

Se også

Litteratur