Intrebari din Examen Flashcards
(53 cards)
Ce reprezintă proprietatea de idempotentă a operației morfologice de deschidere?
Proprietatea de idempotentă a operației morfologice de deschidere indică faptul că aplicarea repetată a operației de deschidere pe o imagine binară nu modifică rezultatul după prima aplicare. În termeni formali, dacă 𝐴 este o imagine binară și 𝛾(𝐵) este operatorul de deschidere, atunci 𝛾(𝛾(𝐴))=𝛾(𝐴). Aceasta înseamnă că deschiderea unei imagini deja deschise nu schimbă imaginea.
Ce este funcția densității de probabilitate cumulativă (CDF) a unei imagini grayscale?
Funcția densității de probabilitate cumulativă (CDF) a unei imagini grayscale reprezintă distribuția acumulată a valorilor de intensitate. Pentru un nivel de intensitate 𝑖, CDF este suma probabilităților tuturor nivelurilor de intensitate de la 0 până la 𝑖. Matematic, se definește ca 𝐶𝐷𝐹(𝑖)=∑𝑗=0𝑖𝑃𝐷𝐹(𝑗), unde FDP este funcția densității de probabilitate. CDF este utilizată pentru operații precum egalizarea histogramei, care îmbunătățește contrastul imaginii.
Ce este extinderea muchiilor prin histereza în procesarea imaginilor?
Extinderea muchiilor prin histereza este o tehnică utilizată în detectarea muchiilor, în special în metoda Canny. Aceasta implică aplicarea a două praguri: unul înalt și unul jos. Punctele de muchie cu o valoare a gradientului peste pragul înalt sunt marcate ca muchii puternice, iar cele cu valori între cele două praguri sunt marcate ca muchii slabe. Punctele de muchie slabe sunt păstrate doar dacă sunt conectate la puncte de muchie puternice, ceea ce ajută la eliminarea zgomotelor și la crearea unor contururi continue.
Ce sunt modelele de culoare Lab și Luv?
Modelele de culoare Lab și Luv sunt spații de culoare utilizate pentru a reprezenta culorile într-un mod care reflectă percepția umană.
o: Modelul de culoare Lab: Este un spațiu de culoare tridimensional în care L reprezintă luminozitatea, a reprezintă componenta de culoare pe axa verde-roșu, iar b reprezintă componenta de culoare pe axa albastru-galben. Este utilizat pentru editarea imaginii și în aplicațiile unde consistența culorilor este importantă.
o: Modelul de culoare Luv: Este similar cu modelul Lab, dar diferă în formula de calcul. L reprezintă luminozitatea, iar u și v sunt coordonate cromatice. Este folosit în grafică computerizată și în aplicații de colorimetrie pentru a evalua diferențele de culoare.
Care metrică de similaritate poate fi utilizată în algoritmul de segmentare prin region splitting?
În algoritmul de segmentare prin region splitting, una dintre metricile de similaritate utilizate este varianța intensității pixelilor dintr-o regiune. Dacă varianța intensității într-o regiune depășește un anumit prag, regiunea este considerată neomogenă și este divizată în sub-regiuni mai mici. Alte metrici de similaritate includ distanța Euclidiană, distanța Manhattan sau criterii bazate pe histograma intensității pixelilor. Aceste metrici evaluează uniformitatea unei regiuni și decid dacă trebuie împărțită sau fuzionată cu alte regiuni.
Cum se convertește distanța focală din [mm] în [pixeli]?
-Transformarea coordonatelor punctului în pixeli [u, v]:
Du= 1/dpx și Dv = 1/dpy
-Dimensiunea pixelilor [dpx, dpy]:
dpx= dx⋅Ncx/Nfx și dpy = dy*Ncy/Nfy
-Calculul distanței focale în pixeli:
fx = fDu= f/dpx
fy = fDv = f/dpy
Ce reprezintă proprietatea de ortogonalitate a matricei de rotație?
Proprietatea de ortogonalitate a matricei de rotație înseamnă că rândurile și coloanele matricei sunt vectori ortogonali unitari. Matematic, o matrice R este ortogonala daca R^T*R = I. Aceasta păstrează lungimea și unghiurile vectorilor în timpul rotației.
Ce este dreapta de proiecție a unui punct 3D pe planul imagine?
Dreapta de proiecție a unui punct 3D pe planul imagine este linia dreaptă care trece prin punctul 3D și centrul de proiecție (punctul focal al camerei). Această dreaptă intersectează planul imagine în punctul proiecției, determinând coordonatele 2D ale punctului 3D pe imagine.
Care este diferența dintre proiecția laterală și top-view (bird eye view) a unei scene 3D?
Proiecția laterală arată o scenă 3D dintr-un unghi lateral, adesea folosită pentru a vizualiza înălțimea și adâncimea obiectelor. Top-view (bird eye view) oferă o vizualizare de sus în jos a scenei, evidențiind aranjamentul orizontal și distanțele dintre obiecte.
Ce este procesul de stereocorelatie (stereocorespondență)?
Procesul de stereocorelatie (stereocorespondență) implică identificarea punctelor corespondente în două imagini capturate din unghiuri diferite de către două camere. Aceasta se face prin evaluarea similarității între ferestrele de pixeli din cele două imagini, folosind metrici precum suma diferențelor absolute (SAD) sau suma pătratelor diferențelor (SSD), pentru a calcula disparitatea și a obține informații despre adâncime.
Ce reprezintă proprietatea de “idempotenta” a operației morfologice de deschidere (imagine binară)?
Proprietatea de idempotenta a operației morfologice de deschidere pentru o imagine binară indică faptul că aplicarea repetată a deschiderii nu modifică rezultatul după prima aplicare.
Ce semnificație au valorile spectrului Fourier centrat?
Valorile spectrului Fourier centrat reprezintă contribuția diferitelor frecvențe spațiale în imagine. Frecvențele joase sunt localizate în centrul spectrului și corespund variațiilor de intensitate pe arii mari, în timp ce frecvențele înalte sunt la periferie și corespund detaliilor fine și muchiilor din imagine.
Ce reprezintă gradientul unei imagini color?
Gradientul unei imagini color este calculat separat pentru fiecare componentă de culoare (R, G, B). Gradientul total al imaginii color poate fi obținut prin combinarea acestor componente, de exemplu prin calcularea magnitudinii gradientului pentru fiecare componentă și apoi combinarea lor într-un gradient total.
Care este efectul vizual al unui filtru median comparativ cu un filtru average de dimensiune variabilă?
Filtrul median elimină zgomotul “salt și piper” fără a estompa muchiile, menținând detaliile ascuțite. Filtrul average (media) netezește imaginea prin estomparea detaliilor fine și a muchiilor, reducând zgomotul dar introducând o estompare generală. Efectul variază în funcție de dimensiunea filtrului; dimensiuni mai mari netezesc mai mult imaginea, dar pot pierde mai multe detalii.
Ce este un senzor de imagine color de tip Bayer-pattern?
Un senzor de imagine color de tip Bayer-pattern utilizează un aranjament de filtre color pentru a captura imagini color. Fiecare pixel al senzorului este acoperit de un filtru roșu, verde sau albastru, dispuse într-un model de mozaic Bayer (2x2), cu un filtru verde pentru fiecare filtru roșu și albastru. Datele de culoare complete sunt obținute prin interpolare.
Ce este distorsiunea radială?
Distorsiunea radială este o deformare a imaginii care apare din cauza curburii lentilelor. Aceasta face ca liniile drepte să pară curbe, în special la marginile imaginii. Distorsiunea radială este de obicei corectată prin ajustarea parametrilor optici în modelul de cameră.
Ce este matricea de proiecție a camerei?
Matricea de proiecție a camerei este o matrice 3x4 care descrie transformarea punctelor 3D din sistemul de coordonate al lumii în puncte 2D pe planul imaginii. Aceasta combină parametrii intrinseci și extrinseci ai camerei pentru a realiza proiecția.
Ce este o linie epipolară?
O linie epipolară este linia pe care trebuie să se afle punctul corespondent din a doua imagine pentru un punct dat din prima imagine în sistemele stereo. Aceasta este determinată de pozițiile relative ale celor două camere și ajută la restrângerea spațiului de căutare pentru corespondente
Ce este centrul de masă al unui obiect binar?
Centrul de masă al unui obiect binar este punctul în care masa obiectului ar fi concentrată dacă ar fi distribuită uniform. Se calculează ca media ponderată a coordonatelor tuturor pixelilor care fac parte din obiect.
Ce este calea dintre 2 pixeli care aparțin unui obiect binar?
Calea dintre 2 pixeli care aparțin unui obiect binar este o secvență de pixeli conectați care permite trecerea de la un pixel la altul. Aceasta poate fi de tip 4-conectivitate sau 8-conectivitate, în funcție de direcțiile permise de conectare.
Ce reprezintă operația morfologică de închidere?
Operația morfologică de închidere este o dilatare urmată de o eroziune. Aceasta este utilizată pentru a umple golurile mici și pentru a netezi contururile obiectelor, fără a altera semnificativ dimensiunile acestora.
Ce este contrastul mediu al unei imagini grayscale și cum se cuantifică?
Contrastul mediu al unei imagini grayscale reprezintă diferența medie de intensitate între pixelii adiacenți. Se cuantifică prin calcularea deviației standard a valorilor de intensitate ale pixelilor din imagine.
Ce reprezintă magnitudinea transformatei Fourier a unei imagini grayscale?
Magnitudinea transformatei Fourier a unei imagini grayscale reprezintă amplitudinea componentelor frecvenței imaginii. Aceasta oferă informații despre variațiile de intensitate la diferite frecvențe spațiale.
Ce este zgomotul Gaussian și cum poate fi eliminat?
Zgomotul Gaussian este un tip de zgomot aleatoriu cu o distribuție gaussiană a intensității. Poate fi eliminat prin aplicarea unui filtru Gaussian, care netezește imaginea și reduce variațiile datorate zgomotului.