Cours 8 Flashcards

1
Q

Quelles sont les deux catégories de scènes visuelles?

A

1) Scènes naturelles:
-Paysages: montagnes, forêt, déserts. Ces scènes évoquent typiquement des émotions et souvenirs distincts
-Étendues d’eau: océans, lacs, rivières, chutes d’eau. Le mouvement de l’eau ajoute des aspects dynamiques à la perception des scènes
-Conditions météorologiques: Journées ensoleillées, pluie, neige, brouillard. Affecte notre perception des scènes en affectant la visibilité, les conditions de lumière et l’esthétique générale
-Biomes: savanes, forêts tropicales, récifs coralliens. Reconnaitre des biomes spécifiques implique intégrer des infos sur végétation, vie animale et caractéristiques du terrain
2) Scènes artificielles:
-Environnements urbains: rues, bâtiments, places, parcs
-Environnements intérieurs: maisons, bureaux, cafés, bibliothèque
-Lieux culturels: bâtiments religieux, monuments historiques, musée
-Scènes dynamiques: Carrefours, marchés bondés, évènements sportifs. Fait intervenir attention dynamique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Y a t’il une différence entre la reconnaissance des scènes et la reconnaissance des objets?

A

Oui, les deux impliquent des processus cognitifs distincts.
La principale différence entre ces deux processus réside dans la manière dont notre cerveau traite et interprète les infos visuelles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Caractéristiques de la reconnaissance d’objets:

A

-Implique l’identification et la catégorisation d’éléments individuels dans notre champ visuel, tels que des objets, des personnes ou des animaux
-Se concentre sur les caractéristiques spécifiques de ces éléments: forme, taille, couleur, texture
C’est par le traitement de ces caractéristiques que l’on peut distinguer les objets les uns des autres

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Caractéristiques de la reconnaissance des scènes:

A

-Contrairement à la reconnaissance d’objets, la reconnaissance des scènes englobe une compréhension plus large et plus globale de l’enviro visuel
-Ne se limite pas à identifier des éléments individuels, inclut interprétation du contexte, compréhension des relations spatiales entre les objets et capacité à saisir le sens global
-Nécessite une intégration des infos visuelles à un niveau supérieur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Pourquoi le contexte est t’il important dans la reconnaissance des scènes?

A

Il fournit des infos supp qui aident à interpréter les objets dans leur environnement
-Aide à prédire quels objets sont susceptibles d’être présents et comment il sont disposés spatialement, améliorant ainsi notre capacité à comprendre et à interagir avec notre enviro

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quel est le rôle des relations spatiales?

A

-Font référence à la disposition et à l’organisation des objets dans l’espace
-Comprendre la disposition des objets est essentiel pour interpréter une scène
-Ces relations aident à déterminer la structure d’une scène et à comprendre comment naviguer ou interagir avec l’enviro

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est ce que la théorie des affordances? (théo de la reconnaissance des scènes)

A

-Ne se base pas sur une analyse détaillée des éléments visuels, mais sur la perception des affordances, c-à-d les possibilités d’actions offertes par l’enviro
-Cette théorie explique bien la rapidité et l’efficacité de la reconnaissance des scènes dans la vie quotidienne
-Cependant, ne prend pas en compte la capacité à reconnaitre des scènes complexes ou ambiguës
*Emphase sur l’action, sur ce que la scène peut nous donner, nous fournir

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est ce que la théorie des images intrinsèques?

A

-Une image peut être décomposée en un ensemble d’images intrinsèques chacune représentant une propriété fondamentale de la scène qu’elle dépeint
-Ces propriétés incluent: réflectance (proportions de lumière réfléchie par les surfaces de la scène), illumination (qté et direction de la lumière tombant sur surfaces), distance des surfaces par rapport à caméra (profondeur)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est ce que la théorie des composantes? Nommez les 5 classes de relations entre les objets

A

-Tout comme dans la reconnaissance des objets, la théorie des composantes de Biederman joue un rôle dans la reconnaissance des scènes.
-On peut reconnaitre une scène rapidement de par les relations entre les objets qui la constituent.
-5 classes de relations entre les objets:
1.Interposition (les objets interrompent leur arrière-plan)
2. Le support (objets ont tendance à reposer sur des surfaces)
3. Probabilité (objets ont tendance à se trouver dans certaines scènes mais pas dans d’autres
4. Position
5. Taille familière (les objets ont un ensemble limité de relations de taille avec d’autres objets)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Propriétés de l’enveloppe spatiale, Scene-gist (théorie autour du traitement de l’info) de Aude Oliva.

A

-Modèle computationnel de la reconnaissance de scènes du monde réel qui ne repose pas sur la segmentation et le traitement d’objets ou de régions individuels
-Identifie un ensemble de dimensions perceptuelles (5 dimensions) qui représentent la structure spatiale dominante d’une scène
-Ces infos peuvent être estimées de manière fiable en utilisant des infos spectrales et grossièrement localisées
-La perfo du modèle d’enveloppe spatiale montre que des infos spécifiques sur la forme ou l’identité des objets ne sont pas une exigence pour la catégorisation des scènes ***
-Ont développé des images hybrides, qui combinent l’info spectrale de deux scènes
-Décomposition des différentes fréquences spatiales de l’image qui va filtrer pour révéler seulement une certaine bande de fréquence
-Peut faire changer notre perception de l’image quand il diminue la taille de l’image sur notre rétine, change quelle bande de fréquence qui sera perçue. Ex: ville et plus petit sur la rétine on va voir un corridor
-Basse fréquence = forme générale d’une scène
-Haute fréquence = détails d’une image. Les deux sont des caractéristiques de bas niveau

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est ce que la grammaire de la scène?

A

-Désigne les règles structurelles et les relations sémantiques au sein d’une scène qui guident notre perception et compréhension
-Elle nous permet de déchiffrer des scènes complexes en identifiant comment les objets interagissent et se rapportent les uns aux autres dans des contextes spécifiques
-Ce concept aide à expliquer notre capacité à interpréter rapidement les scènes, à reconnaitre les anomalies et à anticiper la position des objets même dans des enviro inconnus
-La grammaire de scène joue un rôle clé dans l’allocation de l’attention, la mémoire des objets et de leurs emplacements, et le traitement cognitif des infos visuelles. ‘Map cognitive’ de notre enviro qui nous permet d’y naviguer
-Notre connaissance de la localisation habituelle des objets dans une scène nous permet de faire des prédictions efficaces et très rapides

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

RSVP (Rapid Serial Visual Presentation)

A

-Avec slmt 13 ms de présentation, pn peut facilement détecter dans une séquence rapide de scènes, la scène du mariage par ex.
-Dans cet exemple par contre il est nécessaire de connaitre d’abord la cible
-Le cerveau a besoin de moins de 150 ms pour différencier des scènes de différentes catégories (naturelle, artificielle) **
-En moins de 120 ms, une saccade oculaire est faite vers la scène d’une catégorie spécifique**

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Bases neuronales de la reconnaissance des scènes. Quelles sont les régions cérébrales impliquées (5)?

A

-Lobe occipital: Traite des infos visuelles de base comme les lignes, les couleurs et les textures. Les premières étapes de traitement de la scène se déroulent ici
-Cortex parahippocampique: Joue un rôle crucial dans le traitement de la disposition de la scène, des relations spatiales et de l’essence d’une scène. PPA (place area)
-Cortex inférotemporal: Impliqué dans la reconnaissance d’objets et contribue à la compréhension de la scène en identifiant les objets dans la scène
-Cortex rétrosplénien: Intègre les infos spatiales de différentes zones, facilitant la navigation et la compréhension de la scène
-Cortex préfrontal médian: Intègre divers aspects du traitement de la scène (objets, dispo spatiale, contexte) avec les connaissances et les souvenirs antérieurs, ce qui permet la compréhension de la scène

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Différence entre propriétés de bas et de hauts niveaux:

A

-Bas niveau: Choses que l’on doit nommer ou décrire. Propriétés physiques (couleurs, textures, lumières)
-Haut niveau: Dès qu’on doit expliquer quelque chose on est dans le haut niveau

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

À quoi sert le LLM (large langage model)?

A

-Le LLM n’utilise pas l’activité cérébrale. On utilise cette activité pour prédire une séquence possible de toutes les descriptions possibles et on compare notre prédiction au LLM pour générer une phrase descriptive.
-Dans le fond, ce qu’on teste c’est plus s’il y a correspondance entre le cerveau et un LLM dans le traitement de l’information sémantique plus qu’on teste si le LLM peut décrire ce qu’un participant voit.
-Ces activations, celles du cerveau et du LLM, sont ensuite utilisées pour entraîner un “encoding model”. Les encoding models prennent un stimulus et tentent de prédire l’activité dans le cerveau (ou dans un réseau de neurones) que génère ce stimulus.
-Ces mêmes activations sont aussi utilisées pour faire de la RSA (representational similarity analysis) afin de voir si la façon dont les LLM encodent la description des scènes est similaire à la façon dont le cerveau a encodé la description des scènes. C’est-à-dire s’ils représentent l’aspect sémantique des scènes de façon similaire.

13
Q

Nommez les mécanismes de géolocalisation (3)

A

1.Cellules de lieu hippocampiques (mémoire): s’activent à des endroits spécifiques d’une scène, contribuant à la navigation spatiale et à la reconnaissance de la scène
2. Cellules de direction de la tête: Groupe spécialisé de neurones trouvés dans des zones du cerveau telles que le thalamus, le cortex entorhinal et le cortex rétrosplénial. Jouent un rôle crucial dans la navigation spatiale en fournissant au cerveau un signal constant de l’orientation de notre tête dans l’espace, agissant comme une boussole interne
3. Cellules de grille: Trouvées dans le cortex entorhinal, elles forment une représentation en grille de l’espace, contribuant à la navigation dans la scène et aux cartes mentales
-O’Keefe et les Moser recoivent en 2014 un prix Nobel pour leur découverte des cellules de lieu et de grilles

14
Q

Qu’est ce que les cellules de bordures?

A

-Les cellules frontalières sont retrouvés dans la formation hippocampique, spécifiquement dans des régions comme le subiculum, le présubiculum et le cortex entorhinal
-Jouent un rôle distinct dans la navigation spatiale en codant la présence de limites environnementales. agissant comme des gardiens de bords au sein de notre carte mentale