Reconhecimento de palavras faladas Flashcards
(80 cards)
O que é o léxico?
É o nosso dicionário mental, entrada para as milhares de palavras que temos e os diversos tipos de informação sobre as palavras. O falante médio conhece entre 50 000 e 75 000 palavras.
O que está armazenado no léxico mental?
- Fonológico: sons das palavras – informação
- Sintático: ordem das palavras num frase - lexical
- Semântico: significado das palavras - armazenamento
Durante o reconhecimento de palavras faladas, o léxico mental atua como mediador entre que domínios?
- Análise fonético-acústica do sinal linguístico recebido
- A interpretação sintática e semântica da mensagem
Qual é o continuum de compreensão de uma palavra?
- Fonética: dividir a palavra nos seus fonemas (e.g. [g] [a] [t] [u])
- Nível fonológico: representa a forma fonológica da palavra, ou seja, como deve ser pronunciada /gatʊ/
- Nível de lema (lemma level): refere-se a características gramaticais da palavra como nome, singular, etc.. (e.g. gato é um nome singular)
- Nível conceitual: representa o significado da palavra, e.g. o gato é um animal felino pequeno
Qual é a velocidade de compreensão de palavras faladas?
- temos a capacidade de compreender o discurso a uma taxa de 20 fonemas por segundo
- conseguimos identificar palavras faladas em contexto cerca de 200 ms após o seu onset (menos de um sílaba)
O que é o speech shadowing?
Os participantes ouvem uma fala e tentam repetir o mais rápido possível:
- fast shadowers: conseguem repetir as palavras quase instantaneamente (250 a 300 ms)
- distant shadowers: demoram cerca de 500 ms
O que é a monitoração de palavra-fonema?
- ouvem um discurso e têm de clicar num botão assim que ouvem uma palavra ou fonema alvo
- numa frase normal, as pessoas geralmente demoram 300ms a reconhecer e reagir à palavra-alvo
Quais são as duas principais características do discurso?
- transiente (porque o som desaparece assim que é produzido)
- contínuo (porque não há pausas entre palavras)
Quais são os problemas do reconhecimento do discurso?
- segmentação
- invariância
Qual é o problema da segmentação?
Os sons misturam-se e não podem ser facilmente separados.
Quais são as estratégias que utilizamos para fazer a segmentação?
- fonotáticas
- palavras possíveis
- segmentação stress-based
Em que consiste a estratégia de segmentação fonotática?
- são regras sobre quais sequências de sons são permitidas numa língua
- por exemplo, “lost ball” pode ser segmentado corretamente, mas [tb] não ocorre naturalmente no inglês
Em que consiste a estratégia de segmentação “palavras possíveis”?
- a segmentação depende de quais combinações formam palavras possíveis
- por exemplo, “fill a green bucket” está correto, mas “filigree n bucket” está incorreto (não faz sentido em inglês)
Em que consiste a segmentação stress-based?
- estratégia de segmentação da fala que se baseia nos padrões de acentuação (stress) da língua. O ouvinte usa a posição das sílabas tónicas (acentuadas) como pistas para identificar o início de palavras
- no inglês (mas não no francês) as sílabas tónicas têm maior probabilidade de ocorrer no início de palavras de conteúdo (como substantivos e verbos) do que em palavras funcionais (preposições e artigos) que geralmente não são acentuados
O que é a invariância?
Ideia errada de que cada fonema tem uma forma acústica única e constante.
Na realidade, isso não acontece, um mesmo fonema pode soar diferente, surgindo a coarticulação.
O que é a coarticulação?
Realização de fonemas pode variar dependendo da posição e dos fonemas que os rodeiam.
Que fenómenos principais causam a coarticulação?
- transmissão paralela
- assimilação
O que é a transmissão paralela (coarticulação)?
- as propriedades de um som espalham-se pelos sons ao seu redor
- exemplo: o som [g] em gato e guerra não é exatamente o mesmo
O que é a assimilação (coarticulação)?
Os fonemas assumem propriedades acústicas do que os rodeiam
Quais são os benefícios que a coarticulação traz?
- para o falante: permite produção da fala mais rápida e fluente
- para o ouvinte: a propagação da informação relacionada a um fonema por vários segmentos permite que os ouvintes prevejam os sons que vêm a seguir
Qual é a questão que está envolvida na compreensão da modelação da linguagem falada?
Temos de identificar os fonemas antes de identificar a palavra?
Quais são as 2 rotas que Marslen-Wilson (1984) definiu para a identificação de fonemas?
- rota acústica-fonética
- rota lexical
Em que consiste a rota acústica-fonética de Marslen-Wilson (1984)?
Não envolve reconhecimento da palavra. A resposta é puramente baseada na análise acústica-fonética (análise do som que nos chega)
Em que consiste a rota lexical de Marslen-Wilson (1984)?
- determinamos que o fonema está presente ao utilizar conhecimento fonológico armazenado da palavra em questão.
- o ouvinte reconhece a palavra primeiro (ou começa a reconhecê-la) e isso ajuda a identificar o fonema que está presente