Un sistem de măsurare pentru urmărirea comportării unei construcţii este o entitate coordonată alcătuită dintr-un număr de aparate de măsură şi control montate pentru obţinerea parametrilor fizici în vederea prelucrării informaţiilor obţinute. Măsurătorile obţinute din cadrul sistemului de urmărirea comportării construcţiilor pot fi folosite pentru un proces de modelare. Modelul este o reprezentare externă şi explicită a unei părţi din realitate, care a fost pus în evidenţă de către indivizi care doresc să utilizeze acest model la înţelegerea, modificarea şi conducerea acelei părţi din realitate. Modelul trebuie verificat şi validat, adică este sau nu corect cu respectarea sistemului „real”. Cu ajutorul modelului se va putea construi o prognoză, adică o predicţie a ceea ce se va întâmpla în viitor, pe baza măsurătorilor obţinute. Clasificarea tehnicilor de prognoză care pot fi utilizate în mare măsură în procesele decizionale sunt prezentate mai jos.

Analiza regresiei

În practica activităţii de urmărire a comportării construcţiilor se intâlnesc fenomene care pot fi determinate de una sau mai multe cauze. Prin analiza (metoda) regresiei se cercetează statistic legătura dintre variabile prin intermediul unor funcţii, denumite funcţii de regresie. Notând cu y variabila dependentă şi cu x1, x2 ... variabilele independente, ecuaţia statistică de regresie este:

y = f(x1,x2,...) + ε , unde ε = eroare aleatoare cu dispersia constantă şi media nulă.

În funcţie de numărul factorilor (x1,x2,...xn) care influenţează caracteristica rezultativă (y) deosebim :

- regresie unifactorială sau simplă, dacă funcţia include un singur factor ;

- regresie multifactorială sau multiplă, dacă funcţia include mai mulţi factori.

Alte legături neliniare, prin diverse transformări, pot fi aduse sub forma unor legături liniare pentru care pot fi estimaţi coeficienţii ecuaţiei liniare din regresie. Pe baza măsurătorilor se poate construi un model statistic obţinut prin metoda regresiei ce va fi validat şi utilizat pentru prognoză.

Coeficienţii ecuaţiilor de regresie se estimează cu metoda celor mai mici pătrate sau metoda verosimilităţii maxime.

Testele utilizate pentru validarea modelului liniar sunt:

- testul Student pentru independenţa variabilelor;

- testarea semnificaţiei estimatorilor prin analiza varianţelor;

- stabilirea legăturii între R2 (coef.determinare) şi F (distribuţia);

- compararea coeficienţilor de regresie pentru două sau mai multe modele liniare.

Începând cu documentaţiile din 2001 am folosit un program de calcul al ecuaţiilor de regresie de diverse forme, pornind de la ecuaţia dreptei şi continuând cu ecuaţii polinomiale, raţionale, vârf, tranziţie şi sume de la două până la patru ecuaţii simple. Alegerea celei mai bine ajustate ecuaţii la măsurători s-a făcut prin intermediul îndeplinirii uneia din următoarele condiţii :

- maximului coeficientului de determinare r2;

- maximului coeficientului de determinare ajustat;

- erorii standard;

- maximului erorii;

- maximului statisticii F pentru egalitate, dublată de condiţia ca reprezentarea grafică a ecuaţiei de regresie să fie compatibilă cu evoluţia fenomenului fizic urmărit.

Cu acest program s-au estimat nişte ecuaţii de regresie provizorii folosind datele din perioada 1988÷2000 (exceptând cele de la forajele hidrogeologice 1990÷2000) de la: temperaturi, niveluri, reperi de nivelment baraj şi centrală, pendul baraj, cât şi foraje hidrogeologice aval şi adiacente digului mal stâng şi mal drept. Limitele de predicţie s-au stabilit cu probabilitatea 90÷99% astfel încât să acopere majoritatea sau integral şirul de măsurători.

Atragem atenţia că limitele respective au un caracter dinamic, ele urmând a fi recalculate pe măsura creşterii volumului şirului de măsurători şi a neîncadrării măsurătorilor ulterioare.

Pentru predicţia limitelor temperaturii medii zilnice s-a folosit o ecuaţie de regresie cu 5 coeficienţi de forma: tmz = b1 + b2cosθ + b3sinθ + b4sin2θ + b5 sinθ cosθ, în care θ = 2πn/ 365,24, n = ziua din cadrul anului.

Pentru măsurătorile de la hidrometrele din barajul deversor, cu datele avute la dispoziţie (fişiere *mdb* de la Slatina, *.xls* de la ISPH, *.xls* de la Serviciul UCC Hidroelectrica) s-au construit fişierele cele mai complete. Cu aceste date s-au estimat coeficienţii de corelaţie în funcţie de nivelul amonte, nivelul aval, funcţia sezonieră şi diferenţa de nivel.

Pentru măsurătorile de la hidrometrele cu coeficienţi de corelaţie mai mari decât cei minim calculaţi s-au estimat în sensul celor mai mici pătrate câte o ecuaţie de regresie de forma:

subpresiune = b1 + b2e -t/t1b3e t/t2 + b4h + b5h2 + b6w + b7w2 + b8cosθ + b9sinθ + b10sin2θ + b11sinθcosθ; unde t = timpul, h = (Nam - Nam min)/ (Nam max - Nam min); w = (Nav - Nav min)/ (Nav max - Nav min); iar θ = 2πn/ 365, n = ziua din cadrul anului.

S-au eliminat DH3-1; DH5-2; DH6-2; DH1-4; DH1 şi DH6 culee.

Principalii indicatori statistici obţinuţi pentru fiecare ecuaţie de regresie multiliniară cât şi coeficienţii ei pentru şirul de măsurători IV.87÷XII.04 sunt prezentaţi în anexe.

Pe baza ecuaţiilor de regresie estimate s-au calculat limitele dinamice de forma: limite = estimaţie ± 1,96 x abaterea standard corectată. Limitele superioare acoperă, în general, măsurătorile din 2004. Au putut fi constatate excepţii îndelungate în cadrul întregului şir de măsurători la: DH3-2, DH2-3, DH3-3, DH6-3, DH3-4, DH6-4, DH3-cmd şi DH5-cmd când s-au înregistrat măsurători constante în timp.

Măsurătorile din 2004 au fost acoperite de limitele prognozate cu probabilitatea de 99% cu excepţia datelor de 8 şi 9 Ianuarie şi 6 Februarie.

Au fost construite mediile mobile ale temperaturii şi nivelurilor de ordinul 1÷365 zile având pasul de 7 zile. Aceste medii mobile reprezintă ajustarea mecanică a tendinţei de lungă durată din cadrul fiecărei serii de măsurători. Prin această metodă se elimină componenta sezonieră (periodică). Ele au servit pentru stabilirea coeficienţilor de corelaţie între acestea şi măsurătorile la pendul.

Cu măsurătorile efectuate la pendulul invers s-au estimat tendinţele liniare de formele:

deplasarea = f (timp); deplasarea = f (media mobilă de ordinul 91/ 119 zile a temperaturii); deplasarea = f (media mobilă de ordinul 182/ 168 a nivelului amonte); deplasarea = f (media mobilă de ordinul 224/ 175 a nivelului aval). Tendinţele liniare, adăugate la norii de măsurători reprezentaţi funcţie de una dintre încărcările mai sus menţionate, scot în evidenţă existenţa corelaţiilor cauză-efect, în special cu mediile mobile ale temperaturii subliniate şi de valorile mari ale coeficienţilor liniari de corelaţie (-0,805 pentru dx şi 0,812 pentru dy).

Cu aceleaşi măsurători de la pendulul din barajul deversor, începând cu 1996, în fiecare an, s-au estimat limitele dinamice ale unor ecuaţii de regresie cu 11÷15 coeficienţi în vederea verificării acestor măsurători. Pentru şirul de măsurători 1999÷2004 s-au estimat limitele dinamice a unei ecuaţii de regresie cu 13 coeficienţi.

Ecuaţia de regresie de tip aditiv este de forma:

deplasarea = b1 + b2t + b3t2 + b4t3 + b5t4 + b4h + b5h2 + b6h3 + b7h4 + b8cosθ + b9sinθ + b10sin2θ + b11sinθcosθ (unde: t = timpul, h = sarcina hidrostatică amonte, θ = 2πn/ 365,24 n = numărul zilei din cadrul anului). Ea serveşte la construirea celor două limite cu care se vor compara măsurătorile din 2004. De asemenea, pe baza coeficienţilor estimaţi au fost prezentate funcţiile de deplasări în condiţii identice = deplasarea – f (h) – f (θ); de tendinţă f (t); de nivel f (h) şi de temperatură f (θ). Limitele dinamice estimate pentru fiecare deplasare (amonte-aval; mal-mal) de la fiecare pendul au acoperit măsurătorile efectuate în 2004 dovedind o reală adaptare a acestui tip de ecuaţie de regresie la măsurători.

Tendinţa estimată pentru direcţia x (-0,32÷-2,75) se situează la 2,43 mm, adică 0,41 mm/ an cu evidenţierea unei stabilizări în 2004. În acelaşi timp pe direcţia y tendinţa estimată ajunge la 0,85 mm (0,60÷1,45), adică 0,14 mm/ an. Se evidenţiază în 2003÷2004 o tendinţă de deplasare spre „+; mal drept”. (Convenţia de semne este +x = aval; +y= amonte). Considerăm utilă demararea unei acţiuni de prelucrare avansată şi comparare a rezultatelor de la măsurătorile obţinute pentru majoritatea pendulelor care echipează barajele deversoare şi centralele de mică cădere din România.

În 2001 s-au estimat ecuaţiile de regresie la măsurătorile provenite de la forajele hidrogeologice adiacente digurilor şi cele din aval. Ecuaţiile cel mai bine ajustate la măsurători sunt de forma: y= a+be-x; y-1= a+bx3; lny= a+bx3, unde y= nivelul hidrodinamic, iar x= nivelul din bieful aval sau amonte dupa caz. Cu probabilitatea de 95÷99% s-au construit limitele cu care să se verifice măsurătorile efectuate după 2001 la aceste foraje hidrogeologice.

Limitele estimate pentru 4 foraje hidrogeologice din avalul nodului hidrotehnic şi pentru forajele hidrogeologice de la km 1+700; 4+688 şi 9+580 adiacente digului mal stâng au acoperit măsurătorile din 2004 cu următoarele excepţii:

  • FHg2 mal drept aval – 22 Septembrie; 14 şi 27 Octombrie când nivelul amonte a scăzut de la 84,22 la 80,93 mdM;

  • FHg4 mal drept aval – idem.

Limitele pentru aceste două foraje vor fi folosite în continuare urmând a se lua o hotărâre de recalculare a lor după completarea şirului de măsurători cu un nou an.

Pentru reperii de la coronamentul centralei s-au estimat funcţii de regresie de forma: deplasarea = f (nivelul amonte) pe baza cărora s-au construit limitele superioară şi inferioară. În cazul măsurătorilor de nivelment interesează ca limita inferioară să acopere măsurătoarea pentru nivelul dat. Funcţiile cele mai ajustate s-au dovedit a fi de forma:

y = a+bx^3; y = a+bx^0,5; y = a+b/ x; y = a+b/ x2; (la 13 reperi din 29); y = a+b/ x^(1,5); y = a+b lnx/ x şi y = a+bx^(0,5) lnx; unde y = deplasarea verticală iar x = nivelul amonte. Reprezentarea grafică şi valorile tabelare ale limitelor estimate pentru măsurătorile de nivelment de la coronamentul centralei sunt prezentate în anexe. Limitele construite în 2001 pentru reperii de nivelment din baraj (coronament şi galeria de drenaj) acoperă măsurătorile din 2004 dovedind reala lor adaptare la şirul de măsurători. Pentru reperii de nivelment de la coronament şi din galeriile barajului deversor şi centralei s-au estimat ecuaţii de regresie cu 11 coeficienţi (de tip EdF) cu care s-au construit limitele dinamice. Indicatorii statistici estimaţi pentru şirurile de măsurători 1987÷2004 sunt apropiaţi de cei estimaţi anterior (1987÷2001; 2002; 2003) iar indicii de corelaţie sunt identici. acest fapt demonstrează că măsurătorile introduse în 2004 nu influenţează negativ ecuaţiile cu 11 coeficienţi. Cu alte cuvinte aceste măsurători nou introduse reflectă o comportare normală a uvrajelor supravegheate prin acestea. Măsurătorile din 2004 sunt acoperite de limitele dinamice estimate. Pentru o reprezentare grafică adecvată s-a folosit numai intervalul 1995÷2004 din întregul şir 1987÷2004. Cu limitele construite cu o probabilitate de 95% s-au verificat măsurătorile din 2004 dovedind reala lor adaptare.

Tendinţele hiperbolice calculate cu 3 coeficienţi estimaţi din cei 11  scot în evidenţă stabilizarea tasărilor încă înainte de 1992.

În anexe sunt reprezentate funcţiile de temperatură şi nivel calculate pe baza coeficienţilor estimaţi pentru reperii de la coronamentul barajului.

Ca şi pentru pendule, considerăm necesară efectuarea unei acţiuni de prelucrare avansată şi de comparare a rezultatelor obţinute de la reperii de nivelment montaţi pe barajele şi centralele de mică cădere din România.

Subliniem că la ora actuală, în România se utilizează mai multe programe pentru estimarea ecuaţiei de regresie în care numărul coeficienţilor pentru fiecare funcţie variază de la caz la caz (chiar se mai adaugă medii mobile de diferite ordine ale temperaturii aerului). Dupa propria părere modelul aditiv de tip EdF cu 11 coeficienţi este unul dintre cele mai folosite datorită ajustării acestui tip la măsurători cât şi a numărului redus de coeficienţi.

Limitele dinamice pot fi stabilite cu formula: calculat ± k x (abaterea standard reziduală); kЄ1,645÷3,291 corespunzătoare cuantilelor de probabilitate 99% (respectiv 97,5%). Limitele dinamice acoperă majoritatea măsurătorilor. Subliniem că pe măsură ce probabilitatea de depăşire devine mai mică în cazul unei comportări normale a construcţiei, lăţimea benzii acoperite de către limitele dinamice creşte. Orice depăşire a acestor limite scot în evidenţă una din situaţiile ce trebuie analizate:

  • măsurătorile depăşite de limite sunt probabil eronate;

  • apariţia unui fenomen evolutiv care ar putea pune în pericol siguranţa construcţiei.

Toate ecuaţiile de regresie, implicit limitele dinamice au fost estimate cu programe proprii.

Serii de timp

Fiecare serie de timp este câte o realizare a unui proces stochastic, în general nestaţionar, pentru care, variabila independentă este timpul. rezultă că, evoluţia multor fenomene urmărite prin orice sistem de supraveghere cu AMC-uri pot fi privite ca serii de timp. Analiza oricărei serii de timp permite obţinerea legii care guvernează fenomenul descris de serie şi, în consecinţă, face posibilă predicţia evoluţiei fenomenului. Metodologia statistică care se ocupă cu analiza acestor date se numeşte analiza seriilor de timp. Caracteristica esenţială a acestei abordări este total diferită de alte analize statistice. Analiza seriilor de timp recunoaşte explicit importanţa ordinii de apariţie a observaţiilor. Celelalte analize statistice se bazează pe o abordare globală a obsrvaţiilor.

În lucrarea „ Popescu Th. – Serii de timp – Aplicaţii în analiza sistemelor” – Ed. tehnică, 2000, sunt descrise mai multe modele de reprezentare a seriilor de timp mono şi multivariabile şi anume: 1) modelul liniar general; 2) modelul autoregresiv (AR); 3) modelul de medie alunecătoare (MA); 4) modelul autoregresiv şi de medie alunecătoare (ARMA) şi 5) modelul autoregresiv integrat şi de medie alunecătoare (ARIMA).

Odată stabilită structura modelului, iar parametrii acestuia au fost estimaţi, urmează validarea modelelor. În general, tehnicile de diagnoză-validare a modelelor seriilor de timp pot fi împărţite în trei grupe având ca obiect:

  • analiza staţionarităţii;

  • analiza reziduurilor;

  • supradimensionarea sau subdimensionarea modelului.

Numerotarea modelelor este următoarea: 1) modelul liniar general; 2) modelul autoregresiv (AR); 3) modelul de medie alunecătoare (MA); 4) modelul autoregresiv şi de medie alunecătoare (ARMA) şi 5) modelul autoregresiv integrat şi de medie alunecătoare (ARIMA).

Metodele de predicţie pot fi grupate în: I) modele specifice seriilor de timp şi II) modele cauzale. Dintre metodele de tip I) se pot menţiona:

  1. metoda netezirii exponenţiale care utilizează media ponderată a celor mai recente observaţii ale variabilei care face obiectul analizei. Valorilor seriei le sunt asociate un set de ponderi care descresc exponenţial, astfel încât celor mai recente valori le sunt asociate ponderile cele mai mari;

  2. metoda Holt-Winters care reprezintă o versiune mai avansată a primei metode putând fi utilizată şi în cazul în care seria prezintă o componentă tendinţă şi/ sau sezonieră;

  3. metoda descompunerii care consideră seria analizată ca fiind compusă dintr-un număr de componente: tendinţă, sezonieră şi aleatoare; primele două componente sunt estimate şi utilizate pentru predicţia valorilor viitoare;

  4. metoda Box – Jenkins care utilizează modele de tip ARMA sau cazuri particulare ale acestora;

  5. metoda Bayes care se bazează pe determinarea mai multor modele inclusiv a probabilităţilor asociate care sunt actualizate pe măsură ce mai multe bdate devin disponibile.

Dintre metodele de tip II) se pot menţiona următoarele:

  1. metoda regresiei multiple în care relaţiile dintre variabila dependentă şi variabilele independente sunt realizate de ecuaţiile de regresie. În urma estimaţiei coeficienţilor variabilelor independente din ecuaţia de regresie multipla se determină valorile variabilei dependente pentru diferite valori ale valorilor variabilelor independente;

  2. metoda econometrică care foloseşte sisteme de ecuaţii de regresie interconectate;

  3. metoda Box - Jenkins multivariabilă care reprezintă o extensie a metodei Box – Jenkins din cadrul seriilor monovariabile şi care necesită stabilirea unor relaţii explicite între variabilele independente şi variabilele dependente prin intermediul funcţiilor de transfer.

La ora actuală există pe Internet o multitudine de programe cu care se pot modela serii de timp şi pe baza acestor modele estimate se pot prognoza date pe o perioadă de timp.

La adresa http://www.forecastingeducation.com/ se află câteva pagini web care conţin o recenzie a soft-urilor de prognoză: după tip; după nume; după publicaţia care-l menţionează; după prezentări speciale.

În paginile respective, într-un tabel, sunt enumerate drept cele mai bune programe de serii de timp tip ARMA, următoarele: AUTOBOX, SCA PC-Expert, X12-ARIMA, WinX-11, CB Predictor, ITSM 2000.

Unele din aceste programe pot fi descărcate de pe Internet şi folosite gratuit. Noi am folosit un model românesc semnalat tot de o pagină de statistică de pe Internet, care la ora actuală nu mai există şi anume: http://www.profiware.com.

Modelele sunt grupate într-o manieră ierarhică: categoria modelului (ex. uni, multivariat-una, mai multe ieşiri, sau reţea neuronală), familia modelului (ex. netezirea exponenţială = exponential smoothing) şi tipul modelului (ex. „Holt-Winters exponential smoothing with a multiplicative seasonality”).

În cadrul acestui program sunt rulate 23 de modele din care este ales cel mai potrivit pe baza criteriului LSE (least sum of squared errors). Formulele modelelor ARMA şi a celor de netezire exponenţială au fost prezentate în anexele din documentaţiile anterioare.

Modelele disponibile în aceste programe sunt: AR, ARMA, netezire exponenţială (nivel constant, tendinţă atenuată, tendinţă exponenţială, tendinţă liniară şi regresie liniară aditivă), zero, mers aleator ş.a.

Preprocesările transformă o serie de timp într-o altă serie de timp, uzual cu o structură mai simplă. Se utilizează următoarele preprocesări:

  • de-tendinţă:

    • media, tendinţa liniară, tendinţa logistică, tendinţa exponenţială, tendinţa atenuată

  • de- sezonalizare:

    • sezon adăugat, sezon multiplicativ

  • generale:

    • diferenţiere, logaritm, reziduală.

Chiar dacă programele destinate modelării şi predicţiei seriilor de timp sunt în general eficace privind calculul matematic, rezolvarea oricărei probleme practice necesită un timp de lucru semnificativ. Informaţia disponibilă, a priori, referitoare la natura fenomenului analizat poate contribui la reducerea timpului de analiză.

Determinarea valorilor parametrilor modelului se va putea face din cadrul unei clase restrânse de structuri pe baza unor criterii, după cum urmează:

  • criteriul erorii finale de predicţie FPE (Final Prediction Error);

  • criteriul informaţiei Bayes BIC (Bayesian Information Criterion);

  • criteriul lungimii de descriere minime MDL (Minimum Description Length);

  • criteriul celei mai mici sume a pătratelor erorii LSE (Least Sum of squared Errors).

În cazul predicţiei imediate sau pe termen scurt nu există suficient timp pentru culegerea de noi date, pentru o eventuală verificare a modelului cu noi date, motiv pentru care o parte din ultimele măsurători avute la dispoziţie sunt folosite pentru validarea modelului. Modelele cauzale necesită volume mai mari de date pentru predicţie decât modelele tip serii de timp.

Theodor Popescu, prezintă în cartea sa („Serii de timp – Aplicaţii în analiza sistemelor” Ed. Tehnică, 2000) necesarul de date în vederea alegerii metodei de predicţie. Astfel pentru metoda netezirii exponenţiale sunt necesare cel puţin10 observaţii disponibile, metoda Holt – Winters pt. date nesezoniere sunt necesare 15 observaţii, metoda descompunerii Box – Jenkins şi metoda regresiei multiple, cel puţin 30 de observaţii, iar metoda Box – Jenkins multivariabilă necesită cel puţin 60 de observaţii.

Pentru date sezoniere, metoda Holt – Winters necesită cel puţin 2 perioade de date (dacă s = 12 atunci n = 24), metodele decompunerii, Box – Jenkins şi regresiei multiple necesită cel puţin 6 perioade de date, iar metoda Box – Jenkins multivariabilă, cel puţin 8 perioade de date.

Chiar dacă modelele folosite în acest volum sunt univariate şi cuprind date culese la perioade inegale de timp, ele au oferit prognoze destul de credibile, acoperind măsurătorile prezentate în continuare.

Am estimat modele tip serii de timp pentru: media lunară şi anuală a temperaturii şi pendulul invers din baraj din 10 modele estimate pe baza LSE s-au ales drept cele mai bune modele tip ARMA. Cu ajutorul acestor modele s-au prognozat câte 12 date pentru 2004 pe ambele direcţii pentru care s-au construit prognoze pentru următoarele 12 date. Astfel limitele prognozate acoperă mediile lunare măsurate ale temperaturii şi debitului afluent.

Au fost prezentate toate aceste modele de serii de timp pentru susţinerea afirmaţiei de la începutul prezentei anexe referitoare la diversitatea metodele folosite în predicţia datelor.

Metodele separării surselor se bazează pe ipotezele de independenţă statistică între diferitele efecte. Aceste efecte se regăsesc prin separarea surselor furnizate de o reţea de senzori.

Semnalele măsurate de către fiecare senzor în parte reprezintă câte o combinaţie liniară a efectelor produse de către diferitele cauze. Astfel, deplasarea brută sau măsurătoarea (observaţiile de la pendule) poate fi considerată ca fiind un „amestec” al acestor deplasări datorate diferitelor cauze la care s-a adăugat un zgomot de măsură.

Presupunând că deplasarea măsurată este o combinaţie liniară a surselor (efectelor):

y(t) = A* S(t) + b(t) = x(t) + b(t)

y(t) = vectorul observaţiilor în timp de mărime m

S(t) = vectorul efectelor (surselor) de mărime P

A = matricea de combinare a efectelor (surselor) m x P

Metodele de separare asurselor utilizează o transformare de forma:

S(t) = B * y(t) =  * P * S(t)

S(t) = estimaţia vectorului efectelor

B = matricea de transformare p x m

 = matrice diagonală

P = matricea de permutare

Matricea B reprezintă soluţia ecuaţiei:

B * A =  * P

Metodele de separare a surselor furnizează fiecare efect cu aproximaţia unui factor multiplicativ şi a unei operaţii de permutare.

În urma efectuării unor operaţiuni de căutare pe Internet cu motorul de căutare Google am detectat o pagină de la adresa http: \\www.bsp.brain.riken.go.jp\ICALAB care conţine pachetul de programe ICALAB.

ICALAB pentru procesarea semnalului este un pachet pentru MATLAB© care foloseşte un număr de 19 algoritmi eficienţi pentru analiza componentei independente (ICA) utilizând statisticile de ordin de ordin superior (HOS), separarea oarbă a sursei (BSS), statisticile de ordin secund (SOS), predicţia liniară (LP) şi extragerea oarbă a semnalului (BSE) cât şi diferite metode SOS şi HOS.

ICALAB a fost proiectat şi dezvoltat de către membrii Laboratory for Advanced Brain Signal Processing în frunte cu: Andrzej Cichocki, Shun-ichi Amari, Krzysztof Siweek ş.a.

Principalele părţi componente sunt: instrumentele de preprocesare şi postprocesare.

Instrumentul de preprocesare cuprinde analiza componentei principale (PCA), prealbirea şi filtrarea: filtrarea trece–sus (HPF), filtrarea trece-jos, filtrele subbandă (Butterworth, Chebyshew, eliptic) cu ordin ajustabil al filtrului, frecvenţa subbenzii şi numărul de subbenzi.

Instrumentul de procesare cuprinde: deflaţia şi reconstrucţia („curăţirea”) datelor şirului original prin ştergerea componentelor nedorite, zgomotului sau contrafacerilor.

ICALAB poate fi util în:

  • reducerea redundanţei;

  • descompunerea unor semnale multi-variabilă în componente independente;

  • decorelarea spaţio-temporală a semnalelor corelate;

  • extragerea şi ştergerea unor contrafaceri nedorite prin aplicarea deflaţiei;

  • ştergerea zgomotului sau „curăţirea” şirului de date-senzori;

  • extragerea caracteristicilor şi structurilor;

  • compararea performanţei diferiţilor algoritmi.

Aceşti 19 algoritmi de separare a surselor s-au aplicat la şirurile de la pendulul invers din baraj, separat la hidrometrele din culee mal drept, separat la hidrometrele din deschiderea I (numai cele ale căror măsurători se corelează cu nivelurile din biefuri) şi separat la măsurătorile de nivelment din culee mal drept.

La măsurătorile hidrometrelor din culee mal drept cu algoritmii EVD2 şi JADETD s-au estimat câte 4 surse separate ai căror coeficienţi de corelaţie se situează sub cei calculaţi direct între măsurători şi surse (data, nivel amonte, nivel aval, funcţia sezonieră şi diferenţa de nivel).

Algoritmii SOBI, SOBI – RO şi Pearson au furnizat câte 2 (1) surse estimate care se corelează cel mai puternic cu sursa estimată.

Rezultatele nu sunt pe măsura aşteptărilor, pe viitor vom încerca construirea unei matrici cu date măsurate sincron în vederea separării surselor.

La măsurătorile provenite de la pendulul invers s-au aplicat 18 algoritmi de separare a surselor. În general s-au estimat câte două surse dintre care una se corelează bine cu funcţia sezonieră. Cel mai bine corelate cu 1-2 din sursele reale (data, sezon, nivel amonte şi nivel aval) sunt estimările obţinute cu algoritmii SOBI-RO, JADETD, JADE şi EVD24.

Sunt reprezentate grafic sursele estimate alături de funcţia sezonieră (teta).

Pentru măsurătorile de nivelment din culeea mal drept 17 algoritmi de separare a surselor au furnizatestimări care se corelează cu data, nivelul amonte şi nivelul aval. Cele mai corelate dintre acestea s-au dovedit a fi: sursa S2 estimată cu algoritmul JADE-TD (cu data), sursa S2 estimată cu algoritmul SANG (cu nivelul amonte) şi sursa S3 estimată cu algoritmul NG-FICA (cu nivelul aval).

Atragem atenţia asupra existenţei unui factor multiplicativ în fiecare sursă estimată.

În continuare sunt prezentate abrevierile algoritmilor de separare a surselor aşa cum sunt folosite ele în programul ICALAB:

 

  1. AMUSE – Algorithm for Multiple Unknown Source Extraction based on EVD– algoritm pentru extragerea sursei multiple necunoscute bazat pe descompunerea valorii proprii (eigenvalue decomposition - EVD);

  2. EVD2 – SOS BSS algorithm based on symmetric EVD – statistici de ordinul doi; separarea oarbă a surselor în EVD simetrică;

  3. EVD24 – SOS + FOS BSS algorithm based on symmetric EVD – algoritmul SOS (statistici de ord. 2) + FOS (D) BSS (Blind Source Separation = separarea oarbă a sursei) bazat pe EVD simetric;

  4. SOBI – Second Order Blind Identification – Indentificarea oarbă de ordin secund;

  5. SOBI – RO – Robust SOBI cu ortogonalizare robustă;

  6. SOBI – BPF – Robust SOBI cu banca de filtre trece – bandă.

  7. SONS – Second Order Nonstationary Source Separation – Separarea sursei nestaţionare de ordinul secund;

  8. JADE – op – Robust Joint Approximate Diagonalization of Eigen matrices (with optimized numerical procedures) – Diagonalizare aproximativă a unirii robuste a matricii proprii (cu proceduri numerice optimizate);

  9. JADE TD – HOS Joint Approximate Diagonalization of Eigen matrices with Time Delays – HOS (statistici de ordin înalt) Diagonalizarea unirii aproximative a matricii proprii cu timp întârziat;

  10. FPICA – Fixed Point ICA – Analiza componentei independente punct – fixat.

  11. SANG – Self Adaptive Natural Gradient with nonholonomic constants – Gradient natural auto adaptabil cu constante nonholonomice;

  12. NG – FICA – Natural Gradient Flexible ICA – Gradient natural – Analiza componentei independente (ICA) flexibilă;

  13. Pearson (Pearson System optimized) – Sistem optimizat Pearson;

  14. ERICA – Equivariant Robust ICA – based on Cumulants – Analiza componentei independente (ICA) robustă echivariabilă – bazată pe cumulanţi;

  15. TICA – [Thin QR/ SVD algorithms for ICA (extension of Fixed Point alg)] – Algoritmi QR/ SVD slabi pentru ICA (extensia algoritmului punct – fixat)

  16. SIMBEC – Simultaneous Blind Extraction using Cumulants – Extragerea oarbă simultană utilizând cumulanţi;

  17. UNICA – Unbrased quasi Newton algorithm for ICA – Algorithm quasi Newton imparţial pentru ICA

  18. FOBI – E (Fourth Order Blind Identification with Transformation matrix E) Identificarea oarbă de ordin 4 cu transformarea matricii E;

  19. Symmetric Prewhitening Algorithm – Algoritmul prealbirii simetrice

ICALAB conţine o colecţie de 19 algoritmi pentru albire, ortogonalizare robustă, analiza componentei independente (ICA), separarea oarbă a surselor (BSS) şi extragerea oarbă a surselor (BSE) cu denumirile prezentate mai sus.

Algoritmii mai sus menţionaţi sunt descrişi în capitolul 4 al cărţii „A. Cihocki, S. Amari, Adaptive Blind Signal and Image Processing: Learning Algorithms and Applications”, Wiley, 2003;

De asemenea în capitolul Algorithms in ICALAB al fişierului icalab.html existent în interiorul pachetului de programe ICALABSP v.2.2 sunt prezentate articolele şi adresele web în care sunt prezentaţi algoritmii respectivi.