Visão Computacional Flashcards
(96 cards)
Visão Computacional:
Campo da inteligência artificial que permite a computadores
interpretar e entender o mundo visual, processando imagens e vídeos para obter
informações.
Processamento de Imagem:
Conjunto de técnicas utilizadas para realizar operações em
imagens digitais, com o objetivo de melhorar a qualidade ou extrair informações úteis.
RGB:
Modelo de cor aditivo em que luzes vermelha, verde e azul são combinadas de
várias maneiras para reproduzir uma ampla gama de cores.
Visão Humana:
O sistema biológico pelo qual os seres humanos interpretam e
entendem seu ambiente visual, através dos olhos e do processamento cerebral.
HSV:
Modelo de cor que representa as dimensões de matiz (hue), saturação (saturation)
e valor (value/brightness), frequentemente utilizado em aplicações de processamento
de imagem por ser mais alinhado com a percepção humana de cores.
JPEG:
Formato de arquivo de imagem comum que utiliza compressão com perda,
adequado para fotografias e imagens com transições suaves de cor.
PNG:
Formato de arquivo de imagem que suporta compressão sem perda de dados,
transparência e é adequado para imagens com textos ou bordas nítidas.
TIFF:
Formato de arquivo de imagem usado principalmente em fotografia e gráficos
profissionais, suportando várias profundidades de cor e compressão sem perda
GIF:
Formato de arquivo de imagem usado para gráficos simples e animações,
suportando um número limitado de cores e transparência.
Profundidade de Bit:
Refere-se ao número de bits usados para representar a cor de
cada pixel em uma imagem, afetando a quantidade de cores que podem ser
representadas.
Filtro de Blurring: .
Técnica de processamento de imagem que suaviza os detalhes e
reduz o ruído, criando uma aparência de “borrão”
Filtro de Sharpening:
Processo de aumentar a clareza ou definição de uma imagem,
realçando as bordas e os detalhes.
Rotação:
Transformação geométrica que gira uma imagem em torno de um ponto
central.
Escala:
Transformação geométrica que aumenta ou diminui o tamanho de uma
imagem.
Translação:
Movimento de uma imagem em uma direção específica (vertical ou
horizontal).
CNN (Convolutional Neural Network):
Tipo de rede neural profunda especialmente
eficaz para análise e reconhecimento de imagens e padrões visuais
Mapa de Recursos (Feature Map):
Imagem gerada na CNN após a aplicação de filtros,
que destaca características específicas da imagem original.
Max Pooling:
Operação em CNNs que reduz as dimensões espaciais (altura e largura)
dos mapas de recursos, mantendo apenas os valores máximos de uma região
específica
Visão computaciona
é um campo da inteligência artificial que foca em capacitar
computadores para interpretar e entender o mundo visual. Isso envolve a aquisição, o
processamento, a análise e a compreensão de imagens digitais e padrões de dados
visuais. O objetivo final é que as máquinas possam identificar e processar imagens de
maneira semelhante ao olho humano, mas com a capacidade de análise e
processamento de dados que ultrapassam as limitações humanas.
Histórico da Visão Computacional
Década de 1950 e 1960: As raízes da visão computacional podem ser traçadas até os
primeiros dias da inteligência artificial. Pesquisadores começaram a experimentar
maneiras de permitir que as máquinas “vissem” e reconhecessem padrões em
imagens. Estes primeiros esforços foram bastante básicos devido às limitações da
tecnologia de computação da época.
Década de 1970:
Houve um progresso significativo no campo, com pesquisadores
desenvolvendo algoritmos mais avançados para reconhecimento de formas e
objetos. Durante este período, a visão computacional começou a se diferenciar do processamento de imagens, com um foco maior na interpretação de cenas visuais,
em vez de apenas processar e manipular imagens digitais.
Décadas de 1980 e 1990
Com o advento de computadores mais poderosos e o
desenvolvimento da teoria dos algoritmos, a visão computacional começou a se
tornar mais sofisticada. Neste período, começaram a surgir aplicações práticas, como
sistemas de inspeção industrial e reconhecimento facial.
Século 21
A ascensão da aprendizagem profunda e das redes neurais convolucionais
(CNNs) revolucionou o campo da visão computacional. Estas tecnologias permitiram
avanços significativos na precisão e na eficiência do reconhecimento e classificação
de imagens, tornando possíveis aplicações como carros autônomos, diagnósticos
médicos automatizados e sistemas de segurança avançados.
Reconhecimento Facial e Biometria:
Uma das aplicações mais conhecidas da visão
computacional é o reconhecimento facial, utilizado em sistemas de segurança,
desbloqueio de smartphones e verificação de identidade. Além disso, a biometria,
que pode incluir a identificação de impressões digitais, íris e até características
comportamentais, depende em grande parte de técnicas de visão computacional.