Overvåget læring er en af metoderne til maskinlæring , hvor det testede system tvinges til at lære ved hjælp af eksempler på stimulus-respons. Fra et kybernetisk synspunkt er det en af typerne af kybernetiske eksperimenter . Der kan være en vis sammenhæng mellem input og referenceoutput (stimulus-respons), men dette er ukendt. Kun et begrænset sæt præcedenser er kendt - "stimulus-respons"-par, kaldet træningsprøven. Baseret på disse data er det nødvendigt at genoprette afhængigheden (at bygge en model af stimulus-respons-forhold, der er egnet til prognoser), det vil sige at bygge en algoritme, der er i stand til at give et ret præcist svar for ethvert objekt. For at måle nøjagtigheden af svar, såvel som for at lære ved eksempler , kan en kvalitetsfunktion indføres .
Dette eksperiment er et specialtilfælde af et kybernetisk eksperiment med feedback. Opsætning af dette eksperiment forudsætter eksistensen af et eksperimentelt system, en træningsmetode og en metode til at teste systemet eller måle egenskaber.
Det eksperimentelle system består igen af det testede (brugte) system, rummet af stimuli modtaget fra det ydre miljø og forstærkningskontrolsystemet (regulator af interne parametre). Som et forstærkningskontrolsystem kan der bruges en automatisk kontrolenhed (for eksempel en termostat) eller en menneskelig operatør (lærer), der er i stand til at reagere på reaktionerne fra det testede system og miljøstimuli ved at anvende specielle forstærkningsregler, der ændrer tilstanden af systemets hukommelse.
Der er to muligheder: (1) når responsen fra det testede system ikke ændrer miljøets tilstand, og (2) når systemets respons ændrer miljøets stimuli. Disse skemaer indikerer den grundlæggende lighed mellem et sådant generelt system med det biologiske nervesystem.
Denne sondring giver mulighed for et dybere blik på forskellene mellem forskellige måder at lære på, da grænsen mellem superviseret og uovervåget læring er mere subtil. Derudover gjorde en sådan forskel det muligt at vise visse begrænsninger for kunstige neurale netværk for S- og R-kontrollerede systemer (se Perceptron Convergence Theorem ).
Machine learning og data mining | |
---|---|
Opgaver | |
At lære med en lærer | |
klyngeanalyse | |
Dimensionalitetsreduktion | |
Strukturel prognose | |
Anomali detektion | |
Grafer sandsynlighedsmodeller | |
Neurale netværk | |
Forstærkende læring |
|
Teori | |
Tidsskrifter og konferencer |
|