Q -learning er en metode, der bruges i kunstig intelligens med en agentbaseret tilgang . Henviser til forstærkende læringseksperimenter . Med udgangspunkt i den belønning, der modtages fra omgivelserne, danner agenten en nyttefunktion Q, som efterfølgende giver ham mulighed for ikke tilfældigt at vælge en adfærdsstrategi, men at tage højde for oplevelsen af tidligere interaktion med omgivelserne. En af fordelene ved Q-learning er, at det er i stand til at sammenligne den forventede nytteværdi af tilgængelige aktiviteter uden at skulle modellere miljøet. Gælder situationer, der kan repræsenteres som en Markov beslutningsproces .
Machine learning og data mining | |
---|---|
Opgaver | |
At lære med en lærer | |
klyngeanalyse | |
Dimensionalitetsreduktion | |
Strukturel prognose | |
Anomali detektion | |
Grafer sandsynlighedsmodeller | |
Neurale netværk | |
Forstærkende læring |
|
Teori | |
Tidsskrifter og konferencer |
|