ÁLT Flashcards
(24 cards)
Miért nehéz a tárgylátás?
Egy adott tárgyat nagyon ritkán látunk azonos feltételek mellett. A tárgy retinára vetülő képe gyakran változik, mert más szögből, irányból, távolságból, méretben, színben és más fényviszonyok mellett látjuk.
Azonos kategóriába soroljuk őket (generalizáció), de különbséget is tudunk tenni a kategória tagja között (szelektivitás). A tárgyfelismerés a generalizáció szelekció, nyereség-veszteség vagy vám-rév hatáson múlik.
A tárgyakat egyszerre több specificitási szinten is felismerjük. Az pedig, hogy melyik kategorizációs (felismerési) szintet használjuk, a feladattól függ (élőlény – emlős - házi állat – kutya - németjuhász…)
A tárgy kategóriájának tagjait kisebb eltéréseik ellenére is felismerjük, azonos kategóriába soroljuk (generalizáció) és különbséget tudunk tenni (szelektivitás)
Perceptuális szegregáció
primer látókéregben, V1-ben történik
A tárgyak elkülönítése a háttérből és az együtt megjelenő tárgyakból, amely a tárgylátás egyik alapvető lépése.
Fontosabb tulik:
1. Az alakzat a háttér előtt van
2. A háttér alaktalan anyag
3. A körvonal az alakzathoz tartozik
4. Az alakzat könnyebben megjegyezhető, jobban hasonlít tárgyra, mint a háttér
5. Méret (kisebb inkább alakzat)
6. Szimmetria
7. Orientáció (függ./vízszintes inkább alakzat)
8. Ismertség
**Rubin-váza
A tárgy alakja elkülönül a hátteret alkotó mintázattól.
Mi a Fourier-elemzés?
A matematika azon ága, amely összetett függvények és jelek reprezentációját tanulmányozza egyszerű alaphullámokra való lebontás révén.
A különböző szinuszos összetevőket úgynevezett téri frekvenciacsatornák elemzik
● a magasabb frekvenciákra érzékeny neuronok a finomabb részletek felismeréséért felelősek
● az alacsonyabb frekvenciákra érzékeny neuronok a durvább részletekért felelősek
● az egyes térbeli frekvenciákra hangolt neuronok egymástól független csatornákon dolgozzák fel a látott információt
Fourier elmélete szerint bármely kép felbontható szabályos, szinusz hullámösszetevőkre.
V1
Neurojai a vonalakra érzékenyek
V1 Br. 17 neuronjai eltérő méretű és irányú vizuális ingerekre legérzékenyebbek -» fontos a perceptuális szegregációban
Látórendszer neuronjai téri frekvenciaszűrőkét működnek.
–>kis receptív mező -> magasabb téri frekvenciákra érzékenyek -> finom részletekre érzékenyebbek
–> nagy receptív mező -> alacsonyabb téri frekvenciákra érzékenyek -> durvább mintázatok feldolgozását végzik
Neuronok csoportokba rendeződve oszlopokat alkotnak.
V1ből kiinduló fő pályarendszerek?
- Parietális/dorzális rendszer (Hol? Hogyan?) - V1, V2, V3, V5 (MT)
- Temporális/ventrális rendszer (Mi?) - V1, V2, V4, IT
A parietális rendszer a tárgyak mozgatásáért, míg a ventrális rendszer a szín- és tárgylátásért felelős.
Mi a Gestalt elmélet lényege?
Wundt -> Koffka; Wertheimer; Köhler formálta ki
A tárgy több mint a részek összessége = látott kép több mint a vonaldarabkák összessége; a látott kép tárgyakká szerveződését írja le.
A Gestalt pszichológusok az alakzat-háttér összefüggéseire, a csoportosítás szabályaira és az alakzatok pregnenciájára koncentráltak.
Mik a Gestalt törvények?
- Egyszerűség= legegyszerűbb struktúra a domináns értelmezés
- Hasonlóság =hasonló alakzatokat csoportosítjuk
- Jó folytatás (pregnancia) = azt csop.-uk, aminek görbülete legkevésbé változik
- Közelség
- Közös sors
- Ismertség
vszeg tanulás, tapasztalat útján sajátítjuk el
A zártság is fontos lehet, ami alapján az összeérő éleket zárt alakzatként észleljük.
Mik azok az illuzórikus kontúrok?
Vannak azonban olyan esetek, amikor az alakzat és a háttér kontúrja között nincs fizikai paraméter különbség (pl. Kanizsa-háromszögek), az alakzatot mégis éles kontúrral meg tudjuk különböztetni a háttértől.
Oka, hogy a háromszöget alkotó vonalak egységes felületté integrálódnak, a felület fényesebb a háttérnél, valamint, hogy az azt generáló fekete körök (gondolatban egészítjük ki körökké) előtt helyezkedik el.
Példa: Kanizsa-háromszögek
Valódi kontúrok
Sötétebb vagy világosabb a háttérnél, más színű, más mintázatú, más dimenzióban helyezkedik el, alkotópontjai más irányban mozognak
Ezek a tényezők mind valódi kontúrokkal kapcsolatosak
Strukturális felismerési modell: Komputációs alakfelismerés
David Marr, mi Komputációs elmélet - „mit kellene egy számítógépprogramnak tennie ahhoz, hogy egy képen a tárgyakat pontosan regisztrálják? “
A tárgyészlelés folyamatát három fő szinten tárgyalják:
1. komputációs elmélet
2. a reprezentáció és a végrehajtó algoritmus
3. a szükséges hardver
4 lépésben határozták meg a folyamatot:
● 1.lépés: az elmélet a retinára vetülő képpel kezdődik
● 2.lépés: az algoritmus ezután a képben lévő sötét és világos részeket analizálja. Ennek a durva, első vázlat az eredménye (vonalak, körvonalak)
● 3.lépés: az első vázlatból alkotunk a Gestalt-szabályok alapján egy, a már általunk látott képhez hasonló két és fél dimenziós vázlatot
● 4.lépés: a 2,5 dimenziós vázlat alakul tovább háromdimenziós (3-D) képpé
Erőssége: könnyen létre tud hozni egy nézőpont független tárgyreprezentációt.
Gyengesége: nem világos, hogyan is jön létre a 3-D-s reprezentáció ugyanis ezt nem támasztják alá kísérleti adatok.
Marr elmélete a tárgyi észlelés komplexitását célozza
Strukturális modell: Komponensalapú felismerési modell - RBC
Biedermann, A tárgyakat konkáv területeik mentén részekre bontjuk -> 3Ds elemekként tároljuk a memóriánkban -> GEONOK
Geonok: nézőpontfüggetlenül felismerhetők, megkülönböztethetők -> 1 tárgynak csak 1 nézőpontját kell tárolni -> világ kb 36 féle geonból felépíthető
Előny: korlátozott számú elemel képes a tárgyak nézőpontfüggetlen leírására
Hátrány: nem tér ki arra, hogy a felület is fontos a tárgy felismerésében + vannak azonos GEONú, de mégis más tárgyak
A geonok a tárgyak nézőponttól független azonosítását segítik
Képalapú felismerési modellek
Közös jellemzőik: 1. A feldolgozás során úgy őrződnek meg a tárgyak tulajdonságai, ahogy a látott képen jelentek meg
2.A tárgyaknak nem 1 3Ds, hanem több 2Ds reprezentációjukat őrizzük meg, számos nézőpontból
- A nézőpontfüggés részben bizonyított, az azonos np.-ból látott tárgyakat hamarabb felismerjük, kevesebb hibával
De: dolgok végtelen száma -> kombinatorikus robbanáshoz vezetne és nem magyarázza honnan tudjuk h. ugyan azt a tárgyat látjuk
A képalapú modellek nézőpont-függő elméletek
Ventrális vizuális rendszer
A tárgyak színéért, milyenségéért felelős (MI rndsz)
Állomásai: V1, V2, V4, IT
- hierarchikus: neurális latencia fokozatosan hosszabbodik, neuronok receptív mezeje fokozatosan nő, egyre bonyolultabb vonásokra érzékenyek
V1: vonalak V2: egyszerű geometriai ábrák V4: komplex, színes ábrák IT: bonyolult tárgyak, arcok
A tárgyak észlelése észlelési kulcsokkal javítható
Kardinális sejtek
Nagymama sejtek, egyes elméletek szerint a vizuális rendszer csúcspontján olyan neuronok helyezkednek el, amik csak egy adott tárgyat - nem lenne gazdaságos, nem is lehetséges (véges számú agykérgi neuronjaink nem lennének elegendőek), korábbi tapasztalatainkat összegezve képesek vagyunk eddig nem látott tárgyakat felismerni
A létezésük gazdaságtalan és nem valószínű
Inferior temporális kéreg (IT)
A tárgylátás központi területe
- IT neuronjainak válasza többé-kevésbé bonyolult alakzatokra a legnagyobb (keresztek, rácsminták, valós és számítógéppel generált tárgyak, állati és emberi arcok, más testrészek).
- Az egyes neuronok
általában néhány tárgyra vagy alakzatra válaszolnak, nincs azonban olyan neuron, ami kizárólag egy tárgy képére reagálna (tehát az IT-ben nincs nagymamasejt).
- Ez a tárgyszelektivitás az alapja lehet a tárgy felismerésnek
A tárgyakat az IT-ben helytől, színtől függetlenül fel tudjuk ismerni = pozicionális és perceptuális invariancia.
Az IT neuronok receptív mezeje nagy, magában foglalja az 1. éleslátás helyét (sárga folt), 2. egész ellenoldali látómezőt és 3. részben az azonos oldali látómezőt is.
Az IT neuronjai komplex tárgyakra és arcokra reagálnak legjobban.
Mi az a perceptuális invariancia az IT-ben?
A tárgyakat színtől, mérettől, helytől függetlenül fel tudjuk ismerni
Ez lehetővé teszi a tárgyfelismerést különböző pozíciókban.
Mi a pozicionális invariancia jelentése az IT neuronok esetében?
A neuronok hasonlóan aktiválódnak egy adott tárgyra, függetlenül annak helyétől.
Milyen elrendeződést mutat az inferior temporális kéreg?
a hasonló tárgyakra szelektív neuronok agykérgi oszlopokat hoznak létre
A hasonló tárgyakra szelektív neuronok lokális csoportokba rendeződnek.
LOC (lateralis occipitalis komplexum)
A tárgyfelismerésben játszik meghatározó szerepet
- aktivitása megnő tárgyak képére
- nem reagál, ha mintázott felületekre, véletlenszerű vizuális zajra
- bemutatott tárgy helyétől függetlenül aktiválódik (pozicionális invariancia)
* méret-, vizuális kulcs- és nézőpont invarianciát mutat
* hasonlóan aktiválódik tárgyak fényképeire és körvonalrajzaira is
A LOC aktivitása megnő, ha tárgyak képét mutatják.
AGYKÉREG KATEGÓRIASPECIFIKUS TERÜLETEI
FFA (arcok), PPA (épületek, helysínek), EBA (emberi test, testrészek)
Miért?: Kat. spec. mod // Feladat és gyakorlás // Szétosztott reprezentáció
Ezek az adott specifikus kategóriába tartozó tárgyak képére aktiválódnak.
Kategória-specifikus modulok
Jerry Fodor, egyes kognitív feladatok specifikus és egymástól függetlenül működő
idegrendszeri modulok aktivitásán keresztül valósulnak meg, ezek FFA, PPA és EBA – spec. területek az adott kategória reprezentációjára
- Viszont sokkal több reprezentálandó kategória van, mint amennyit az agykéreg kapacitása lehetővé tesz
- újragondolt változat: evolúciósan fontos, hogy sokat gyakorolt kategóriákra
kialakulhatnak erősen szervezett speciális modulok, míg a többi kategóriák tagjainak
felismerését változatlanul a ventrális rendszer egészének működése biztosítja
Jerry Fodor szerint ezek specifikus idegrendszeri modulok.
Feladat és a gyakorlás hatására kialakult modulok
Egyes agyterületek specializálódása a szükséges feladat függvényében gyakorlással automatikusan változik, flexibilis
Emberek, akik szakértői vmilyen tárgyaknak az adott kategória tagjait az emberi arcokhoz hasonló módon, hasonló agyterületek aktiválódása mellett dolgozzák és ismerik fel.
Szétoztott reprezentáció elmélete?
halántéklebenyben van egy geometrikus hasonlóságon alapuló tárgy tulajdonság-térkép
A tárgy kategóriáját nem egy körülhatárolt terület, hanem a halántéklebeny területén
szétszórtan elhelyezkedő neuroncsoportok jelentős részének aktivitási mintázata
tükrözi
Gestalt - vonaldarabkák integrációja
- az egyes vonaldarabkákat kódoló V1-neuronok válaszát befolyásolják a mellettük lévő neuronok, illetve a klasszikus receptív mezejükön kívüli, úgynevezett kontextuális ingerek is.
- a darabokból álló kontúrok detekciója jobb, ha az ingerek azonos tengelyre esnek, illetve ha zárt alakzatot alkotnak.
- a neuronok válasza nagyobb egy adott irányú vonaldarabra, ha azzal megegyező irányban, a receptív mezőn kívül egy másik vonaldarabka is elhelyezkedik.