Robot manipulátor - formulácia úlohy optimálneho riadenia

Predpokladáme, že matematický model riadeného dynamického systému je vyjadrený vektorovou rovnicou v tvare:

systém
(1.11)



kde:
optimalne
optimalne
optimalne
optimalne
je n-rozmerný vektor stavu v čase t

je m-rozmerný vektor riadenia v čase t

je n-rozmerná známa funkcia

je definičný interval systému



Úlohou optimálneho riadenia je určiť taký vektor (U je množina prípustných riadení), aby dynamický systém (1.11) prešiel z daného počiatočného stavu optimalne do určeného konečného stavu optimalne a aby kritérium optimálneho riadenia v tvare:


optimalne
(1.12)




nadobudlo minimálnu hodnotu, kde je daná funkcia. Takýto vektor riadenia a jemu zodpovedajúcu trajektóriu nazývame optimálnymi

Problém optimálneho riadenia môžeme rozdeliť na 2 úlohy:

Programové optimálne riadenie (POR)


Nech je dané:

Úlohou programového optimálneho riadenia je nájsť také riadenie, ktoré prevádza dynamický systém z počiatočného stavu do požadovaného koncového stavu a minimalizuje kritérium optimálneho riadenia (1.12)

Problém sledovania pomocou dopredných a inverzných neurónových modelov v riadiacej štruktúre s dopredným regulátorom

V tejto časti za zameriame na aplikáciu neurónovej siete typu MLP v riadiacej štruktúre s dopredným regulátorom na riešenie problému sledovania optimálnej trajektórie (Optimal Neuro-Tracking Problem) pre nelineárny systém - robot - manipulator, ktorého model dynamiky budeme uvažovať v stavovom priestore.

Úlohy optimálneho sledovania trajektórie manipulátora s dvoma stupňami vožnosti pozostáva z dvoch etáp:

Na obr. 1.1 je znázornená riadiaca štruktúra s neurónovým regulátorom, ktorý sa skladá z dvoch neurónových sietí typu MLP:

optimalne
Obr. 1.1 Štruktúra zapojenia s neurónovým regulátorom

kde:

xref(k)
uref(k)
dx(k)
du(k)
u(k)
x(k)
vektor optimálnych trajektórií
vektor optimálnych riadiecich zásahov
vektor odchýliek od predpísanej trajektórie
korekcia vektora riadiaceho zásahu
aktuálny vektor riadiaceho zásahu
reálny výstup nelineárneho dynamického systému robota-manipulátora.

Ako trénovaciu množinu dát pre neurónovú sieť NN1, ktorá je trénovaná ako inverzný model v zapojení "general learning" (obr. 1.2) použijeme výsledky POR, t.j. vektor riadiacich zásahov uref a vektor nominálnych trajektórií pohybu xref , ktoré sú riešením dvojbodovej okrajovej úlohy algoritmom korekčných funkcií.

optimalne
Obr. 1.2 Trénovanie neurónovej siete NN1




Popis algoritmu programového optimálneho riadenia:

  1. Inicializácia počiatočných hodnôt parametrov
    1. parametre robota - manipulátora(hmotnosti, momenty zotrvačnosti, konštanty akčných veličín), ktoré predstavujú koeficienty sústavy nelineárnych diferenciálnych rovníc
    2. počiatočné podmienky dynamického systému - robota
    3. počiatočné podmienky kovektora
    4. počiatočné podmienky citlivostných rovníc Uij(0)=0 , Vij(0)=1 ak i=j, inač Vij(0)=0
    5. požadovaný koncový stav systému
    6. parametre pre vlastný podprogram, ktorý rieši sústavu diferenciálnych rovníc metódou Runge-Kuta (počiatočný a koncový čas výpočtu, integračný krok)
    7. požadovaná presnosť dosiahnutia koncového stavu
  2. Riešenie systému združených diferenciálnych rovníc a citlivostných rovníc

  3. optimalne
  4. Zapamätanie si hodnôt vektora koncového stavu dosiahnutého v dannej iterácií z aktuálnych počiatočných podmienok
  5. Test na presnosť medzi vypočítaným a vektorom a požadovaným vektorom stavu
  6. Ak nie je splnená predpísaná presnosť dosiahnutia koncového stavu potom:
    1. vypočítamé korekcie, ktoré sú riešením algebraických rovníc:

    2. optimalne
    3. vykonáme opravu počiatočných podmienok kovektora podľa:
      optimalne
      a pokračujeme krokom 2.
  7. Ak predpísaná presnosť dosiahnutia koncového stavu je dodržaná:
    1. vypočítame optimálne trajektórie
    2. grafické znázornenie optimálnych trajektórií a odpovedajúceho optimálneho riadenia

Spätnoväzobné optimálne riadenie (SOR)

Pri reálnych priemyselných robotoch, kde kde nieje splnený predpoklad o konštantnosti parametrov (nepresnosť modelu), je nutné určiť také riadenie, ktoré zabezpečí pohyb dynamického systému (robota-manipulátora) v určitom okolí optimálnej trajektórie. Riadenie získame, ka použijeme korekčný člen - regulátor v spätnej väzbe, čiže riešime úlohu spätnoväzobného optimálneho riadenia

Z uvedeného vyplýva, že skutočný vstup - do riadeného systému je je rôzny od naminálneho vstupu. Teda definujeme nasledovné vzťahy:


vektor odchýlky stavu:
optimalne
(3.1)

a vektor korekcie riadenia:
(3.2)

Predpokladajme, že nelineárny dynamický systém (robot - manipulátor) sa dá vyjadriť vektorovou stavovou diferenciálnou rovnicou:

(3.3)

Ak pravá stranu vzťahu (3.3) rozvinieme do Taylorovho radu v okolí , a vyjadríme v maticovom tvare dostaneme:

(3.4)

kde:
(3.5)

je matica typu (n,n), ktorú získame z prvkov Jacobiánu matice

(3.6)

je matica typu (n,m), ktorú získame z prvkov Jacobiánu matice

Linearizovaný perturbačný model získame, ak zanedbáme vyššie členy Taylorovho radu v rovnici (3.4)

Navrhovaný regulátor v spätnej väzbe viaže veličiny vektor odchýlky stavu a vektor korekcie riadenia lineárnou časovo-premennou väzbou:


kde je matica riadenia

Riešenie deterministického lineárne kvadratického problému vedie na návrh deterministickej spätnej väzby, ktorej úlohou je udržať minimálnu odchýlku od optimálnej trajektórie pohybu.

Štruktúra deterministickej spätnej väzby sa dá znázorniť regulačným obvodom na obr.1:

SOR
Obr.1 Štruktúra deterministického riadiaceho systému

Aplikáca neurónovej siete

Neurónová sieť NN2 v zapojení podľa obr. 1.1 plní úlohu zodpovedajúcu deterministickému regulátoru v spátnej väzbe navrhnutého pri klasickom spätnoväzobnom optimálnom riadení.

Trénovanie neurónovej siete (NN) prebiehalo na základe známeho správania sa navrhnutého deterministického regulátora v spätnej väzbe pre zvolené diagonálne matice Q, R. Schéma zapojenia známeho regulátora a NN2 vo fáze učenia je na obr. 1.3


Obr 1.3 Trénovanie neurónovej siete NN2

Toto zapojenie sa v mnohých literatúrach označuje ako priama identifikácia systému, pričom v tomto našom prípade pod identifikovaným systémom budeme rozumieť známy regulátor.

Popis algoritmu spätnoväzobného optimálneho riadenia robota

  1. Inicializácia počiatočných hodnôt robota manipulátora
    1. parametre robota - manipulátora
    2. počiatočné podmienky dynamického systému - robota
    3. počiatočné podmienky Riccatiho diferenciálnych rovníc K(0)
    4. parametre pre vlastný podprogram, ktorý rieši sústavu diferenciálnych rovníc metódou Runge-Kuta (počiatočný a koncový čas výpočtu, integračný krok)
  2. Načítanie optimálnych trajektórií a odpovedajúcich optimálnych riadení, ktoré boli získané pri programovom optimálnom riadení
  3. Výber váhových matíc Q, R
  4. Výpočty OFF-LINE
    1. zo známych optimálnych trajektórií a optimálneho riadenia vypočítame matice A(t), B(t) pre časovo-variantný prípad podľa (3.7)-(3.8) a matíc A, B pre časovo-invariantný prípad podľa (3.15)
    2. matice A,B predstavujú koeficienty maticovej Riccatiho algebraickej rovnice (3.20), ktorej riešením je konštantná matica K
    3. výpočet matice riadenia G
  5. Simulovanie regulačného obvodu s uvažovaním poruchy a výpočet regulačných odchýlok
  6. Výpočet korekcií riadenia
  7. Výpočet riadenia
  8. Ak čas simulácie regulačného obvodu t=T:
    1. grafické znázornenie priebehu regulácie
    2. výpočet integrálneho kritéria sledovania optimálnych trajektórií
  9. Ak čas simulácie t <T pokračuj kokom 5






Mail napíšte nám
© 2011 CyberEduCentre KKUI FEI TU Košice