Optimal kontrol |
---|
Optimal kontrol er opgaven med at designe et system, der sørger for et givet kontrolobjekt eller proces en kontrollov eller en kontrolsekvens af handlinger, der giver maksimum eller minimum af et givet sæt systemkvalitetskriterier [1] .
Det optimale styringsproblem omfatter beregningen af det optimale styringsprogram og syntesen af det optimale styringssystem. Optimale styringsprogrammer beregnes som regel ved hjælp af numeriske metoder til at finde yderpunktet af en funktionel eller løse et grænseværdiproblem for et system af differentialligninger [2] . Fra et matematisk synspunkt er syntesen af optimale styresystemer et ikke-lineært programmeringsproblem i funktionelle rum [3] .
For at løse problemet med at bestemme det optimale kontrolprogram, konstrueres en matematisk model af et kontrolleret objekt eller proces, der beskriver dets adfærd over tid under indflydelse af kontrolhandlinger og dets egen nuværende tilstand [4] .
Hvis den matematiske model af det kontrollerede objekt eller proces ikke er kendt på forhånd, så for at bestemme det, er det nødvendigt at udføre proceduren til at identificere det kontrollerede objekt eller proces [5]
Den matematiske model for det optimale kontrolproblem omfatter: formuleringen af kontrolmålet, udtrykt gennem kontrolkvalitetskriteriet; definition af differential- eller differensligninger [6] , der beskriver mulige måder at bevæge kontrolobjektet på; definition af restriktioner på de anvendte ressourcer i form af ligninger eller uligheder [7] .
Alle optimale kontrolproblemer kan betragtes som matematiske programmeringsproblemer og kan løses i denne form ved numeriske metoder. [8] [9]
Med optimal styring af hierarkiske multilevel-systemer, for eksempel, anvendes store kemiske industrier, metallurgiske og energikomplekser, multifunktionelle og multi-level hierarkiske systemer med optimal kontrol. Den matematiske model introducerer kriterier for kvaliteten af ledelsen for hvert ledelsesniveau og for hele systemet som helhed, samt koordinering af handlinger mellem ledelsesniveauer [10] [11] .
Hvis et kontrolleret objekt eller en proces er deterministisk, bruges differentialligninger til at beskrive det. De mest almindeligt anvendte almindelige differentialligninger er af formen . I mere komplekse matematiske modeller (for systemer med distribuerede parametre) bruges partielle differentialligninger til at beskrive et objekt . Hvis det kontrollerede objekt er stokastisk, bruges stokastiske differentialligninger til at beskrive det .
Teorien om differentiale spil bruges til at løse optimale kontrolproblemer under forhold med konflikt eller usikkerhed . [12]
Hvis løsningen af det givne problem med optimal kontrol ikke kontinuerligt er afhængig af de indledende data ( il- posed problem ), så løses et sådant problem ved hjælp af specielle numeriske metoder. [13]
For at løse optimale kontrolproblemer med ufuldstændig indledende information og ved tilstedeværelse af målefejl, anvendes maksimumsandsynlighedsmetoden [14] .
Et optimalt styringssystem, der er i stand til at akkumulere erfaring og forbedre sit arbejde på dette grundlag, kaldes et læringsoptimalt styringssystem [15] .
Et objekts eller systems faktiske adfærd adskiller sig altid fra programmet på grund af unøjagtigheder i startforholdene, ufuldstændig information om eksterne forstyrrelser, der virker på objektet, unøjagtigheder i implementeringen af programstyring osv. For derfor at minimere afvigelsen af objektets adfærd fra den optimale, anvendes normalt et automatisk styresystem . [16]
Nogle gange (f.eks. ved håndtering af komplekse objekter, såsom en højovn i metallurgi eller ved analyse af økonomisk information), indeholder de indledende data og viden om det kontrollerede objekt ved indstilling af det optimale kontrolproblem usikker eller uklar information, som ikke kan behandles af traditionelle kvantitative metoder. I sådanne tilfælde kan optimale kontrolalgoritmer baseret på den matematiske teori om fuzzy-sæt ( fuzzy control ) bruges. De anvendte begreber og viden konverteres til en fuzzy form, fuzzy regler for at udlede beslutninger bestemmes, og derefter udføres den omvendte transformation af fuzzy beslutninger til fysiske kontrolvariable. [17] [11]
For optimal styring af økonomiske processer anvendes metoder til økonomisk kybernetik , spilteori , grafteori [18]
Mest udbredt i udformningen af styresystemer til deterministiske objekter med klumpede parametre beskrevet af almindelige differentialligninger, anvendes følgende metoder: calculus of variations , Pontryagins maksimumprincip og Bellmans dynamiske programmering [1] .
Optimalt kontrolproblemVi formulerer det optimale kontrolproblem:
her — tilstandsvektor — kontrol, — indledende og sidste tidspunkter.
Det optimale kontrolproblem er at finde tilstanden og kontrolfunktionerne for tid , hvilket minimerer det funktionelle.
VariationsberegningBetragt dette optimale kontrolproblem som et Lagrange-problem med variationsregningen [19] . For at finde de nødvendige betingelser for et ekstremum anvender vi Euler-Lagrange-sætningen [19] . Lagrange-funktionen har formen: , hvor er grænsebetingelserne. Lagrangen har formen: , hvor , , er n-dimensionelle vektorer af Lagrange-multiplikatorer .
De nødvendige betingelser for et ekstremum ifølge denne teorem er:
De nødvendige betingelser (3-5) danner grundlag for fastlæggelse af de optimale baner. Efter at have skrevet disse ligninger får vi et to-punkts grænseproblem, hvor en del af grænsebetingelserne er sat i det indledende tidspunkt, og resten i det sidste øjeblik. Metoder til at løse sådanne problemer er beskrevet detaljeret i bogen [20]
Pontryagins maksimale principPrincipielt behov for Pontryagin-maksimum opstår, når det ikke er nogen steder i det tilladte område af kontrolvariablen, at det er umuligt at opfylde den nødvendige betingelse (3), nemlig .
I dette tilfælde erstattes betingelse (3) med betingelse (6):
(6)I dette tilfælde er værdien af den optimale kontrol ifølge Pontryagin-maksimumsprincippet lig med værdien af kontrollen i en af enderne af det tilladte område. Pontryagin-ligningerne er skrevet ved hjælp af Hamilton-funktionen , defineret af relationen . Det følger af ligningerne, at Hamilton-funktionen er relateret til Lagrange-funktionen som følger: . Ved at substituere fra den sidste ligning til ligning (3-5), opnår vi de nødvendige betingelser udtrykt i form af Hamilton-funktionen:
Nødvendige betingelser skrevet i denne form kaldes Pontryagins ligninger. Pontryagin maksimum-princippet er analyseret mere detaljeret i bogen [19] .
EksempelLad det være nødvendigt at løse problemet med at minimere det funktionelle:
, hvor , , .Hamilton-funktionen har i dette tilfælde formen:
.Ud fra betingelser 9) og 10) finder vi, at:
, .Vi får:
.Det maksimale af denne funktion med hensyn til , , nås ved , hvor
Efter betingelse ,. Midler:
Fra , får vi . Ud fra kontinuitetsbetingelsen på punktet finder vi konstanten .
På denne måde:
Det kan verificeres, at det er fundet og udgør den optimale løsning af dette problem [21]
Hvor det er relevantMaksimumsprincippet er især vigtigt i styresystemer med maksimal hastighed og minimalt energiforbrug, hvor der anvendes styringer af relætype, der tager ekstreme snarere end mellemværdier i det tilladte kontrolinterval.
HistorieFor udviklingen af teorien om optimal kontrol blev L. S. Pontryagin og hans samarbejdspartnere V. G. Boltyansky , R. V. Gamkrelidze og E. F. Mishchenko tildelt Leninprisen i 1962 .
Dynamisk programmeringsmetodeDen dynamiske programmeringsmetode er baseret på Bellman-optimalitetsprincippet, som er formuleret således: den optimale styringsstrategi har den egenskab, at uanset starttilstand og styring i begyndelsen af processen, skal efterfølgende styringer udgøre den optimale styringsstrategi m.h.t. tilstanden opnået efter den indledende fase af processen [22] . Den dynamiske programmeringsmetode er beskrevet mere detaljeret i bogen [23]
Tilstrækkelige optimalitetsbetingelserTilstrækkelige betingelser for optimaliteten af kontrollerede processer blev opnået i 1962 af V. F. Krotov , på grundlag heraf blev iterative beregningsmetoder til successiv forbedring konstrueret, hvilket gjorde det muligt at finde et globalt optimum i kontrolproblemer [24] [25] [26] .
I opgaver med optimal styring af sådanne objekter som en kontinuerlig varmeovn, en varmeveksler , en belægningsinstallation, en tørreenhed, en kemisk reaktor , et blandingsseparationsanlæg, en høj- eller åben ildovn , et koksovnsbatteri, et valseanlæg mølle , en induktionsvarmeovn osv. den kontrollerede proces beskrives ved partielle differentialligninger, integralligninger og integrodifferentialligninger.
Teorien om optimal kontrol i dette tilfælde er kun udviklet til visse typer af disse ligninger: elliptiske, parabolske og hyperbolske typer.
I nogle simple tilfælde er det muligt at opnå en analog af Pontryagin maksimum-princippet. [27] [28]
Hvis løsningerne af ligningssystemer har ustabiliteter, diskontinuitetspunkter, bifurkationspunkter, multiple løsninger, så bruges en række specielle metoder til at opnå dem [29] .
Optimalt kontrolproblemFor at formulere maksimumprincippet for systemer med distribuerede parametre introduceres Hamilton-funktionen: , hvor hjælpefunktionerne skal opfylde ligningerne og randbetingelserne for , for , .
Hvis er den optimale kontrol, og er de funktioner opnået under den optimale kontrol, der opfylder ligningerne , så når funktionen , betragtet som en funktion af argumentet , et maksimum i regionen ved , det vil sige for næsten alle punkter , ligheden |
Hvis systemet er et lineært system af formen , så sætningen
For optimal styring i det lineære tilfælde er det nødvendigt og tilstrækkeligt, at maksimumsprincippet er opfyldt. |
Se beviset for disse to teoremer i bogen [28] .
I dette tilfælde er det kontrollerede objekt eller proces beskrevet af lineære stokastiske differentialligninger . I dette tilfælde udføres løsningen af det optimale kontrolproblem på grundlag af Riccati-ligningen [30] .
Ordbøger og encyklopædier | |
---|---|
I bibliografiske kataloger |