Mere slicnosti Flashcards

(10 cards)

1
Q

slicnost i razlicitost

A

razlikuje se za tip atributa da li je nominalan, redni ili intervalni/razmerni

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

mera i metrika

A

funkcija rastojanja d je metrika ako:
1.Позитивна одређеност
d(p,q)≥0 ∀ p,q d(p,q)=0 акко p=q
2.Симетриjа:d(p,q)=d(q,p) ∀p,q
3.Неjеднакост троугла:
d(p,r) ≤ d(p,q)+d(q,r) ∀ p,q,r

ultrametrika:
Ако jе функциjа растоjања d метрика и ако важи d(p,r)≤max{d(p,q),d(q,r)} ∀ p,q,r
тада jе функциjа d ултраметрика

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

mere slicnosti za kvantitativne podatke

A

Hamingovo rastojanje, rastojanje minkovskog(p = 1, p = 2, p -> beskonacno), mahalanobisovo rastojanje, rastojanje minkovskog sa tezinama

nedostaci minkovskog:

-Ниjе погодно за примену
код ретких вишедимензионалних података са непознатом расподелом, шумовима, …

-ако постоjе локално ирелевантни атрибути (пример: анализа крви пациjената оболелих од различитих болести) због шума коjи се кумулира при израчунавању

mahalanobis koristan:

Корисно jе када важи атрибути су у корелациjи

атрибути имаjу различите опсеге

вредности (различите вариjансе)

расподела података jе приближно нормална (Гаусова)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

mere slicnosti podataka sa binarnim atributima

A

Zakard i SMC

Prosireni zakardovi koef(koef Tanimotoa)

Kosinusna slicnost

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Korelacija

A

Корелациjа два обjекта коjи имаjу бинарне или непрекидне атрибуте jе мера линеарног односа између њихових атрибута

ковариjанса(x,y) = covxy = n−1 ∑(xk −x)(yk −y)
k=1
􏰎1n стандардна девиjациjа(x) = σx = n−1 ∑(xk −x)
k=1
1n средња вредност(x) = x = n ∑ xk
k=1
Пирсонов коефициjент корелациjе(x , y ) = ρxy = covxy /(σx ∗ σy )

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

slicnost dokumenata

A

slusaj stasu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

podaci sa kvantitativnim i kategorickim atributima

A

slusaj stasu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

slicnost diskretnih podataka

A

edit rastojanje, LCSS

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

mere na osnovu informacija

A

gini i entropija

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

mere na osnovu gustina

A

Мери се степен блискости обjеката у некоj области

Концепт густине се користи у кластеровању и откривању аномалиjа

Нечешће се користе
#Еуклидска густина - броj тачака по jединици површине/запремине
#Густина вероватноће - процена дистрибуциjе података на основу изгледа
#Граф засноване густине - на основу повезаности

How well did you know this?
1
Not at all
2
3
4
5
Perfectly