valutazione motori ricerca Flashcards

(10 cards)

1
Q

cos’è una matrice di confusione? su cosa viene costruita nel caso della valutazione di motori di ricerca?

A

una matrice di confusione è uno strumento di valutazione che viene costruito, in questo caso, andando a valutare le intersezioni fra gli elementi effettivamente ritornati e quelli rilevanti.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

quali sono i possibili 4 casi della matrice di confusione che si può usare per calcolare la bontà di un motore di ricerca

A

veri positivi -> intersezione fra rilevanti e ritornati
veri negativi -> intersezione non rilevanti e non ritornati
falsi positivi -> intersezione non rilevanti e ritornati
falsi negativi -> intersezione rilevanti e non ritornati

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

cosa sono precision e recall in questo caso?

A

recall -> elementi ritornati intersecati elementi importanti / elementi ritornati -> se ritorno tutto -> 1
precision -> elementi ritornati intersecati elmenti importanti / elementi importanti -> se non ritorno nulla -> 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

cos’è f1-score?come si calcola? perchè si calcola così?

A

si calcola come media armonica fra precision e recall; permette di avere un idea sul rapporto di questi; si usa la media armonica in quanto con la media aritmetica sarebbe banale ottenere un f1-score di uno ( recall 1, precision 0 o viceversa; in questo modo invece uno zero distrugge il punteggio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

che tipo di misure si rivelano più utili per la valutazioen dei sistemi rispetto a c’è/non c’è?

A

tutte quelle misure che si basano sull’ordine con cui sono ritornati i risultati

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

cos’è la MAP? come funziona

A

mean average precision, consiste nel applicare la precisione ogni elemento considerato e ritornare la precisione su questi. (curva precision-recall) un errore all’inizio è molto + rilevante in quanto continuo a portarmelo dietro. di solito viene fatta una IMAP (interpoleted map ) e si calcola la precision ogni decile per esempio ( così si evitano fluttuazioni particolari)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

cos’è MRR? come funziona?

A

MRR è mean reciprocal rank, il punteggio ritornato è 1 se la pagina cercata è la prima, 1/2 se la seconda, 1/3 se la terza e così via (credo)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

cos’è normalized discounted cumulative gain?

A

una tecnica di valutazione per la quale ad ogni elemento viene associato un punteggio. sommo il punteggio degli elementi ritornati; la variante discounted prevede dividere tutto per (1+log i) dove i è la posizione in cui è tornato il sito. la variante normalized prevede di dividere l’intero risultato per un punteggio ideale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

come assegno punteggio ad un sito in base ad una query?

A

due opzioni : se ho motore di ricerca monitoro i click e utilizzo euristiche basate su quelli (l’utente esce subito dal sito -> scarso).
in alternativa posso utilizzare dell’information retrivial per la quale ho un algoritmo di intelligenza artificiale fortissimo che calcola gli score in anticipo e che vengono utilizzati al momento della richiesta dell’utente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

cos’è il pulling?

A

metodologia per la quale per valutare dei motori di ricerva prendo i primi tot risultati di diversi motori, li inseirsco in un insieme, assegno un punteggio solo agli elementi di sto insieme e poi calcolo il punteggio dei singoli motori in base ai risultati che avevano tornato in precedenza

How well did you know this?
1
Not at all
2
3
4
5
Perfectly