Cap 2 Chiari Flashcards

1
Q

Quando avvenne l’incontro tra linguistica e informatica?

A

Negli anni Cinquanta del Novecento. Da allora vi sono stati molti progressi, soprattutto grazie alle teorie dei linguaggi formali e AI. Ora vi sono tantissimi dati multimediali e delle comunicazioni e trasmissioni di informazione nella rete internet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Chi diede il primo impulso alla nascita di LC?

A

Warren Weaver, un matematico che aveva in mente l’idea di creare un programma per la traduzione automatica dei testi. Le prime applicazioni furono accompagnate da numerosi finanziamenti e quindi vi furono molti progetti.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Chi è l’autore della Teoria matematica della comunicazione, o teoria dell’informazione?

A

Claude Shannon e Warren Weaver, in cui si mettono insieme lingue e informatica: problemi come la prevedibilità dei messaggi e le caratteristiche statistiche dei testi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Come è intesa la trasmissione da Shannon?

A

Shannon non vuole stabilire il miglior sistema di codifica di messaggi, ma parla di trasmissione come variazione di uno stato fisico e come deve arrivare al destinatario. Non ha interesse per i contenuti, ma sulla possibilità di trasmissione di un messaggio senza troppi errori.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Perché oggi c’è un sovraccarico di informazioni?

A

Info Overload, Glut, Anxiety and Fatigue, sono tutti derivanti dalle troppe informazioni in circolazione e a cui siamo esposti. Essendoci una tale esposizione si sviluppano stati di apatia, indifferenza o esaurimento mentale, uno stress indotto per il tentativo di assimilare troppe informazioni dai media, da internet etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Chi parla di U rovesciata?

A

Siegfried Streufert (1934) parla di U rovesciata come descrittiva della relazione tra informazioni e la loro gestione: prima le informazioni sono utili, ma man mano che crescono diventano dannose. Si parla di diluvio e annegamento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qual è il rapporto tra informazione, prevedibilità e sorpresa?

A

Un informazione che sia prevedibile crea poca sorpresa, meno prevedibile è, più sorpresa suscita. Informazione in questo campo ha una accezione diversa da quella comune.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Cosa si intende con istantaneità comunicativa?

A

Oggi esiste l’Instant messaging che ci permette un’istantaneità comunicativa che sicuramente favorisce la velocità della comunicazione ma va a sfavore dell’efficacia della comunicazione. (Es. DAD, i prof fanno meno fatica a spiegare dal vivo perché ricevono feedback). Le comunicazioni tramite telefono sono più difficili, manca un contesto condiviso. Si perde il valore di spazio e tempo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Perché si parla di Disaggregazione (Disembedding)?

A

Anthony Giddens parla di Disembedding come la separazione dello spazio dal luogo inteso come unità fisica e reale. Questo dà vita anche ai cosiddetti ‘non luoghi’ come aeroporti, un spazio vuoto sebbene pieno di persone. Questo è anche indice di solitudine.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qual è un modo per rappresentare la quantità di informazione?

A

La codifica binaria: il numero di scelte tra due possibilità equiprobabili per raggiungere una particolare informazione.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

In cosa si misura la quantità di informazione?

A

In Bit, binary digit, che è il numero di scelte binarie necessarie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Perché l’informazione è legata all’incertezza dello stato iniziale?

A

Per esempio, più un intervallo di numeri è grande, più è grande l’informazione: prevedibilità e sorpresa.
1. + prevedibilità - sorpresa
2. - prevedibilità + sorpresa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Come espressa l’informazione?

A

Abbiamo un alfabeto ridotto con solo 0 e 1 che verranno impiegati per le sequenze di bit. Es. 1bit = 2 = 0 - 1 / 2 bit = 4 = 00, 01, 10, 11

+ esempio di 2645 (migliaia…)

codifica binaria –> moltiplicare 0 e 1 per le diverse potenze di due, per passare a decimale si divide per 2.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quali sono gli elementi per la trasmissione?

A

Un produttore, dei riceventi, un messaggio, un canale, una codifica(processo di formazione del messaggio), una decodifica (processo di ricostruzione del messaggio) e un rumore.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Cos’è ASCII?

A

American Standard Code for Information Interchange. Secondo tale codifica prima di IBM, poi ISO (International Organization for Standardization), ogni carattere è rappresentato dalla sequenza di 7 bit (128 caratteri).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Cos’è ASCII esteso?

A

Un’evoluzione di ASCII (US-ASCII) che raddoppia da 128 a 256.

ISO 8859-1 (Latin 1) -> caratteri per lingue europee occidentali
ISO 8859-2 -> Europa Orientale
ISO 8859-5 -> caratteri cirillici

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Cos’è il EBCDIC?

A

Extended Binary Coded Decimal Interchange Code a 8 bit. IBM a s6 BCD. Anni ‘50 - ‘60.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Cos’è UNICODE?

A

Favorisce l’interpretabilità. Originariamente 16 bit, ora fino a 21, prende quasi tutte le lingue, anche quelle morte o linguaggio Braille.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Perchè Shannon definisce il ‘teorema fondamentale per un canale discreto con disturbo?’

A

Secondo tale teorema è sempre possibile una codifica che permetta la garanzia della ricezione, senza il costo di un rallentamento troppo forte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Cos’è il RUMORE?

A

Un segnale indesiderato che interferisce con il messaggio trasmesso –> ci saranno differenze tra il messaggio inviato e quello che arriva al destinatario.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Come si evitano i casi di rumore?

A

In genere trasmettitore e ricevitore concordano l’utilizzo di tecniche di codifica e ridondanza –> oltre ai simboli del messaggio, ci sono simboli aggiuntivi che consentono al ricevitore di verificare la corrispondenza del messaggio ricevuto con quello trasmesso.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Cosa si intende per ridondanza?

A

Frazione della struttura del messaggio che non si più scegliere liberamente. È determinata da regole statistiche che governano gli accostamenti dei simboli nei messaggi. Non è necessaria (il messaggio è ricomponibile anche senza di essa).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Perché il modello di Shannon è importante?

A

Ormai il modello di Shannon è applicato in tutte le applicazioni informatiche moderne ed è utile anche per aspetti linguistici, nonostante la spesso eccessiva semplificazione. Negli anni vi sono state diverse critiche.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Quali sono applicazioni dei modelli di Shannon e quelli markoviani?

A

Per esempio, molte applicazioni si hanno per quanto riguarda la lingua parlata, che dagli anni Ottanta a oggi è fortemente dominata da modelli di tipo probabilistico. Infatti, le proprietà statistiche dei testi sono fondamentali

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Chi si oppone a Shannon e Weaver?

A

Noam Chmosky, con i lavori sulla grammatica generativa e trasformazionale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Cosa propone Chomsky nella sua opera Le strutture della sintassi?

A

Egli prevede la possibilità di una completa formalizzazione delle regole di ciascuna lingua. Egli discredita la possibilità di costruire modelli di linguaggio fondati sulla teoria della probabilità.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Perché Chomsky discredita i modelli probabilsitici?

A

Perchè non terrebbero sufficientemente conto di relazioni e dipendenze sintattiche a lunga distanza.

28
Q

In cosa consiste il modello formale di Chomsky?

A

Consiste nella definizione di un insieme di regole sintattiche che permettano la generazione e analisi di tutte le frasi possibili di una lingua.

29
Q

Cosa intende Chomsky per Competenza linguistica?

A

Egli parla di competenza linguistica come capacità interiorizzata anche se non esplicita del parlante nativo di discriminare tra frasi grammaticali e non grammaticali. Allo stesso tempo dice che tale competenze è formalizzabile in una serie di regole astratte che definiscono la grammatica di una lingua.

30
Q

Come si chiama l’approccio basato sulle teorie di Chomsky?

A

Si chiama approccio basato su regole o modellistico.

31
Q

In che modo Chomsky mette in dubbio l’utilità della linguistica dei corpora?

A

Egli rifiuta indirettamente, con una critica al behaviorismo o comportamentismo bloomfieldiano, che si serviva dei corpora e quindi studiavano l’esecuzione (performance), ovvero le realizzazioni linguistiche effettive e prodotte in situazioni concrete.

32
Q

Perché le raccolte di performance linguistiche in un corpus sono un problema?

A

Di fatto, un corpus è di natura FINITO, e spesso incompleto, perché non potrà mai comprendere tutti gli enunciati di una lingua. E le lingue sono potenzialmente infinite, quindi sfuggirà sempre qualcosa.

33
Q

Quale oggetto di studio propone Chomsky in contrasto alle esecuzioni?

A

Chomsky propone la Competenza del parlante come oggetto di studio. La competenza è spesso inconscia, implicita, intuitiva. Ha a che fare con il produrre frasi grammaticali o accettarne e riconoscerne anche di mai sentite.

34
Q

Come dare conto della potenziale infinità delle lingue secondo Chomsky?

A

Tramite la rappresentazione con regole che possono dare vita a un numero infinito di enunciati.

35
Q

Quali sono i 4 punti per riassumere la teoria chomskyana?

A
  1. Un corpus è finito (esclude sempre qualcosa).
  2. Un corpus è incompleto.
  3. Gli enunciati sono sempre influenzati da fattori accidentali e quindi sono imperfetti.
  4. Il corpus dà solo indicazioni sulla frequenza di manifestazione di certe caratteristiche della lingua.
36
Q

Qual è la pecca di Chomsky?

A

Lui, rispetto ad altri, non si occupò mai dell’applicazione della linguistica alle macchine. Altri lo hanno fatto per lui.

37
Q

Qual è un importante settore della LC che richiama il modello chomskyano?

A

Il Natural Language Processing (NLP). Ossia, trattamento automatico del linguaggio naturale.

38
Q

Quali sono i 2 obiettivi del NLP?

A
  1. Implementazione di regole generali per dare al programma la capacità di creare enunciati ben formati.
  2. Data una serie di enunciati, la possibilità di analisi da più punti di vista.
39
Q

Cos’è il parsing, spesso applicato nel NLP?

A

Consiste in un dispositivo (soft, astratto) che a partire da una serie di simboli in sequenza (input) opera una segmentazione (parsing) e restituisce un’analisi della sintassi della frase.

40
Q

Cos’è la grammatica generativa?

A

È un particolare tipo di grammatica formale, una specie di apparato deduttivo di regole.

41
Q

In che senso le grammatiche formali possono essere linguaggi di programmazione?

A

Perché possono dare istruzioni ai computer sul comportamento da adottare di fronte a determinati input.

42
Q

Perché si parla di Gerarchia di Chomsky?

A

Chomsky parla di grammatiche formali principali, che si classificano in base alle restrizioni che impongono. L’idea di raccogliere delle regole aumenta l’applicabilità di tale modello in informatica.

43
Q

Quali sono i 4 tipi di grammatica?

A
  1. Sistemi non ristretti
  2. Sistemi contestuali (context-sensitive)
  3. Sistemi acontestuali (context-free)
  4. Grammatiche regolari
44
Q

Quali sono i modelli di applicazione rispettivamente delle teorie di Shannon e Chomsky?

A

Shannon –> Approccio statistico (corpora)

Chomsky –> Approccio modellistico (regole)

45
Q

Qual è la matrice della posizione chomskyana?

A

L’argomento della Povertà dello stimolo: ovvero l’esposizione di un bambino a input non è sufficiente, ma bisogna risalire alle regole. Chomsky non parla di empirismo, ma di innatismo. Questo argomento è stato criticato da filosofi come Goodman e Putnam, però hanno portano fortuna all’approccio modellistico.

46
Q

Quando si comincia a parlare di AI?

A

Nonostante l’idea di poter costruire macchine artificiali che svolgano compiti umani sia antica, si comincia a parlare di AI (Artificial Intelligence) solo negli anni ‘50. Ovviamente che una macchina faccia le stesse cose di un uomo e assai improbabile, ma la posizione ‘debole’ prevede una ‘simulazione’ del comportamento intelligente, gettando luce su processi cognitivi umani.

47
Q

In cosa consiste il test di Turing?

A

Oggi CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart). Caught you!

Verifica di non essere robot.

Sostanzialmente si porpone di rendere le macchine non distinguibili dagli uomini nei loro comportamenti. Per esempio non si riconosce quale manifestazione linguistica sia stata prodotta da un computer e quale da un umano.

48
Q

Chi fu il primo studioso di AI?

A

Alan Turing. Egli inventò la Macchina di Turing, alla base della teoria della computabilità e dell’omonimo test citato.

Altri studiosi:
1. John McCarthy –> matematico e ideatori di linguaggi di programmazione
2. Marvin Minsky –> tra artefici delle reti neurali artificiali e nozione di frame
3. James McClelland –> padre del connessionismo
4. John von Neumann –> inventore della teoria dei giochi e dell’architettura dei moderni computer.

49
Q

AI e filosofia spesso si incontrano. Quali studiosi possiamo citare?

A

John Searle, Hilary Putnam, Daniel Dennett, Jerry Fodor.

50
Q

Cosa emulavano i primi sistemi?

A

I primi sistemi emulavano giocatori di scacchi o dama.

51
Q

Quale fu il primo emulatore di dialoghi testuali (chatterbot)?

A

Eliza, una psicologa artificiale, che tratteneva conversazioni con utenti ignari che la supponevano umana. Eliza è il primo CHATTERBOT, automa per la conversazione.

52
Q

Chi creò Eliza?

A

Joseph Weizenbaum nel 1966 al MIT (Massachusetts Institute of Technology).

53
Q

In cosa consiste Eliza?

A

Tramite un’analisi delle parole chiave del testo immesso, si propongono risposte adeguate al tema.

54
Q

Perché Eliza ha funzionato così bene e perché si è scelta una psicologa?

A

Perchè il dialogo psicoterapeutico prevede un intervento minimo del terapeuta. L’illusione è quella di comprensione reciproca.

55
Q

Quali sono altri chatterbots creati dopo Eliza?

A

Parry, il paranoico schizofrenico di Kenneth Colby.
Alice
Racter
Dave, l’insegnante d’inglese.

56
Q

Cosa sono i Sistemi Esperti?

A

Questi sono capaci di risolvere problemi nello stesso modo in cui farebbe un umano.

57
Q

Di cosa sono dotati i sistemi esperti?

A

Di basi di conoscenza, ovvero risorse, e di un motore inferenziale che permette l’analisi di dati. Tipicamente prendono decisioni e risolvono i problemi in base a dati incompleti e con tecniche di ragionamento non solo basate su regole ma anche di tipo probabilistico.

58
Q

Di cosa sono capaci i sistemi esperti?

A

Possono, ad esempio, analizzare le cartelle cliniche dei pazienti, fare analisi finanziarie etc.

59
Q

Qual è un’altra applicazione AI?

A

Molti programmi legano insieme AI e neuroscienze.

60
Q

Cos’è la linguistica statistica?

A

Detta anche linguistica matematica, etc., si basa sul pensiero che gli strumenti matematici possano essere utili nello studio del linguaggio. Già i greci e romani parlavano di hapax legomena, parole che occorrono una sola volta.

61
Q

Quali sono i 3 approcci della linguistica statistica o quantitativa?

A
  1. modelli matematici usati per lo studio delle lingue
  2. approcci per estrarre le regolarità statistiche nelle raccolte testuali
  3. processi probabilistici nell’apprendimento, produzione, e ricezione linguistica.
62
Q

In cosa consiste il primo approccio logico-matematico?

A

Il primo approccio tenta di individuare modelli e rappresentazioni matematiche a diversi livelli linguistici tramite ricorso a strumenti algebrici. Esempi di questo approcci sono soprattutto nell’ex URSS e negli Stati Uniti negli anni ‘60 del Novecento. Possiamo citare: Solomon Marcus, Igor Mel’chuk…

63
Q

In cosa consiste l’approccio statistico-descrittivo?

A

Il secondo approccio individua le regolarità statistiche con particolare attenzione al lessico. Tra gli studiosi: George K. Zipf, Benoit Mandelbrot, Guirad, Muller etc. A interessare sono soprattutto i corpora che raccolgono testi di scritto o parlato.

64
Q

A chi si attribuisce la fondazione teorico-metodologica di questo approccio?

A

A Zipf. Nel passato vi erano gli stenografi (Gammes sténographiques di Jean-Baptiste Estoup –> lega la frequenza al rango di una parola e si definisce la centralità della nozione di rango 1907). Zipf mira a adottare una metodologia per lo studio del linguaggio analoga alle scienze esatte, tramite approccio statistico.

65
Q

Quali sono le osservazioni di Zipf e perché parla di Principio del Minimo Sforzo?

A

Zipf nota che la lunghezza delle parole tende a mantenersi in un rapporto inverso al numero di occorrenze nei testi, come il numero delle parole differenti sembri diventare più grande in rapporto alla diminuzione della frequenza di occorrenza, la varietà e la brevità.

Il PMS vede il linguaggio scientificamente, Il tutto con l’intenzione di ottenere il massimo risultato, mediante un impiego minimo di forze. In poche parole: minimo sforzo, massimo rendimento.

66
Q

Quali sono alcuni contributi europei a questo approccio?

A
  1. Guiraud e Muller in Francia: Guiraud fa vedere come si distribuiscono le parole nei testi e spesso hapax (che si vedono una volta sola). In oltre vanno citati Benzécri, Lebart e Salem.
67
Q

In cosa consiste il terzo approccio della linguistica matematica?

A

Il terzo è un approccio di tipo psicolinguistico. Esso considera fattori statistici e le frequenze degli elementi linguistici come interni al meccanismo di apprendimento, di produzione e ricezione. Sottolinea come i fattori statistici giocano un ruolo nella performance linguistica. Solo recentemente però la linguistica ha cominciato a tenere conto di questi 3 approcci.