Modelos baseados em procura Flashcards
(5 cards)
O que é impureza de um nó?
é a medida que indica o grau de heterogeneidade das classes presentes nesse nó.
i(t) = (p1.p2,….pk)
Qual a fórmula para redução da impureza?
d(S) = i(t) - (PL.i(L)+ PR.i(R))
O que é Entropia? e indique sua utilidade em árvores de decisão.
Mede o grau de incerteza (aleatoriedade) de uma variável aleatória
H(A) = - Pi log Pi (somatório)
Em árvores de decisão a entropia é usada como medida de impureza para medir a aleatoriedade
(dificuldade para predizer) do atributo alvo.
O que é Ganho de Informação (C4.5)?
Ganho de informação é uma estratégia que mede redução na entropia nas partições obtidas de acordo com os valores do atributo.
Ganho de informação alcançado selecionando o atributo A para
divisão:
𝐼𝐺 (𝐴, 𝑌) = 𝐻 (𝑌) − 𝐻 (𝑌|A)
Qual a fórmula da impureza dada pelo índice gini?
i(t) = 1 -(somatório de (pi)^2)