Estatística descritiva e análise de dados Flashcards
(95 cards)
ESTATÍSTICA - Resumo
ESTATÍSTICA DESCRITIVA
A Estatística Descritiva ou Dedutiva é o ramo da Estatística que tem por objetivo descrever fatos relacionados a determinado grupo ou população, sem pretender tirar conclusões de caráter mais genérico. É ainda um conjunto de técnicas destinadas à síntese de dados numéricos a partir de informações coletadas.
ATENÇÃO
A coleta, organização e a descrição dos dados estão a cargo da Estatística Descritiva.
A análise e a interpretação dos dados ficam a cargo da Estatística Inferencial.
(CESPE/STM/ANALISTA JUDICIÁRIO/ESTATÍSTICA) Acerca dos conceitos de estatística e dos parâmetros estatísticos, julgue o item seguinte:
A estatística descritiva permite testar hipóteses a respeito da população de interesse. (CERTO/ERRADO)
ERRADO.
Estatística descritiva não testa hipótese nem analisa os dados.
CONCEITOS
- População
- Parâmetro
- Amostra
- Senso
- Estimação
- População: conjunto universo de todos os elementos (pessoas, objetos e outros), com
uma característica comum, objeto de estudo. - Um parâmetro é uma medida numérica que
descreve alguma característica de uma população. Ou seja, imagine que o Gran Cursos Online deseje empreender uma média de todos os seus alunos. Logo, o Gran estará trabalhado com uma população, e a média da população
será o parâmetro. - Amostra: é qualquer subconjunto não vazio de uma população. Uma estatística (estimador) é uma medida numérica que descreve alguma característica de uma amostra.
Digamos que, dentro dos alunos do Gran Cursos Online, buscamos apenas aqueles que estudam para as carreiras policiais. - Censo: é uma avaliação direta de um parâmetro, por meio de dados obtidos de todos os componentes da população. Características: é caro, lento, quase sempre desatualizado,
admite erro processual zero e confiabilidade 100%. - Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador,
por meio do cálculo de probabilidades por meio de uma amostra. É muito mais comum que se busque uma estimação para se empreender uma pesquisa. E isso decorre por causa de suas características: é barato, rápido, atualizado, admite erro processual positivo e confiabilidade menor que 100%.
(CESPE/ABIN/OFICIAL TÉCNICO DE INTELIGÊNCIA/ÁREA 4/2018) Em fevereiro de
2018, o Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) começou a segunda etapa do Censo Escolar 2017, o módulo “Situação do Aluno”. Nessa etapa, serão coletadas informações sobre rendimento e movimento escolar dos alunos ao final
do ano letivo de 2017. Para isso, será importante que as escolas utilizem seus registros
administrativos e acadêmicos, como ficha de matrícula, diário de classe, histórico escolar.
A partir do texto antecedente, julgue o item que se segue, relativo a estatísticas educacionais.
O texto se refere a um estudo censitário de diferentes variáveis da realidade educacional
do país. (CERTO/ERRADO)
CERTO.
DADOS ESTATÍSTICOS
- Dados brutos
- Rol
Os dados amostrais devem ser coletados de modo apropriado, através de um processo de seleção aleatória. Desta forma, se não forem coletados de modo apropriado, podem
se tornar inúteis, ou induzir a erro o processo decisório.
Quando se busca uma amostra de uma população, a amostra necessita ter representatividade.
Dados Brutos: dados obtidos diretamente da observação, os quais não estão numericamente organizados.
Ex.: filhos de certa classe de servidores = F: {2, 1, 3, 1, 2, 4, 6, 5, 3, 4, 2}
Os dados anteriores não estão organizados.
Rol: São dados brutos numericamente organizados, de forma crescente ou decrescente.
Ex.: filhos de certa classe de servidores = F: {1, 1, 2, 2, 2, 3, 3, 4, 4, 5, 6}
Dados Quantitativos x Dados Qualitativos
DADOS QUANTITATIVOS
Dados Quantitativos: possuem características numéricas, representando contagens ou medidas. Os dados aqui serão chamados de variáveis. Podem ser classificados em: discretos e contínuos.
Discretos: são dados que possuem variáveis que assumem determinados valores inteiros, 0 ou 1 ou 2 e assim por diante, em um intervalo de valores.
Exemplos: quantidade de alunos em um curso, quantidade de servidores públicos, quantidade de aparelhos etc.
Para não confundir, imagine o número entre 100 e 101 alunos. É possível haver um aluno
entre 100 e 101? Não! Assim a variável será discreta quando se tratar de números (valores) inteiros.
Contínuos: são dados que possuem variáveis que podem assumir qualquer valor em um intervalo de valores.
Exemplos: altura, peso, salário, temperatura etc.
Imagine dois servidores públicos, um pesa 70 kg e outro 71 kg. Neste caso, é possível haver um número entre 70 e 71? Sim! É possível fragmentar em números decimais o peso, bem como temperatura, altura, salário e outros.
DADOS QUALITATIVOS
Dados Qualitativos: são dados que possuem características não numéricas,
podendo ser separados em diferentes categorias. Os dados aqui serão chamados de atributos. Podem ser classificados em: nominais e ordinais.
Dados nominais: são dados categóricos, que consistem em nomes ou rótulos.
Possuem característica não numérica, logo não podem ser ordenados (tal como do menor
para o maior).
Exemplos: sexo (masculino ou feminino), cor dos olhos (pretos, castanhos, azuis etc.), resposta de sondagem de sim, não e indeciso.
Obs.: muitas vezes são atribuídos valores numéricos para identificar algumas informações
específicas nos comandos das questões.
Para serem processados estatisticamente, são atribuídos valores numéricos a tais atributos.
Dados Ordinais: são dados estatísticos que dependem de uma avaliação subjetiva quanto à preferência ou desempenho em um conjunto de observações. A principal diferença entre os dados nominais e ordinais é que os ordinais têm uma ordem de categorias, enquanto os nominais não. Por exemplo, existem vários termos que representam “ordem” como “Alto, Maior, Máximo” ou “Satisfeito, Insatisfeito, Extremamente Insatisfeito”.
(IMA/PREFEITURA DE PENALVA-MA/AUXILIAR ADMINISTRATIVO/2017) Assinale a alternativa que apresenta o conceito de variável quantitativa discreta:
a. É aquela que expressa o valor de uma contagem, por exemplo, idade, quantidade de
televisores numa casa, quantidade de habitantes de uma cidade.
b. É aquela que separa os indivíduos em classes com uma determinada ordem, por exemplo, nível de escolaridade: fundamental, médio e superior.
c. É aquela que expressa uma medida como um valor real, por exemplo, peso e altura.
d. É aquela que separa os indivíduos em classes, porém não é possível estabelecer uma
ordem, por exemplo, sexo (masculino e feminino) e esporte praticado (futebol, basquete, ciclismo…).
a) Variável quantitativa discreta
b) Variável qualitativa ordinal
c) Variável quantitativa contínua
d) Variável qualitativa nominal
(CESPE/SEDUC-AM/ESTATÍSTICO) A tabela acima contém um conjunto de dados formado por quatro variáveis: RG; gênero
(M = masculino; F = feminino); grau de instrução (1 = analfabeto; 2 = fundamental incompleto;
3 = fundamental completo; 4 = médio incompleto; 5 = médio completo ou superior); e hiperatividade (S = sim; N = não). Com base nessa tabela, julgue o item.
As variáveis mostradas na tabela são qualitativas. (CERTO/ERRADO)
CERTO.
(FCC/DPE-SP/AGENTE DE DEFENSORIA/DESENHISTA INDUSTRIAL) Sobre estatística aplicada, é correto o que se afirma em:
a. Parâmetros são medidas características de grupos, determinadas por meio de uma
amostra aleatória.
b. A estatística descritiva é a técnica pela são coletados dados de uma amostra, a partir
do que são tomadas decisões sobre uma determinada população.
c. A caracterização de uma população se dá por meio da observação de todos os seus
componentes que a integram.
d. A estatística inferencial compreende um conjunto de técnicas destinadas à síntese de dados numéricos.
e. Censo é o processo utilizado para se medir as características de todos os membros de uma dada população.
LETRA E.
a) Parâmetros são medidas características de grupos, determinadas por meio de uma
população.
b) A estatística inferencial é responsável por tomadas de decisões, e não a estatística
descritiva.
c) A estatística atualmente aplicada não se caracteriza de uma população e não se dá por
meio da observação de todos os seus componentes que a integram.
d) A estatística descritiva compreende um conjunto de técnicas destinadas à síntese de
dados numéricos.
(CESPE/TC-DF) Por Estatística Descritiva entende-se um conjunto de ferramentas tais como, gráficos e tabelas, cujo objetivo é apresentar de forma resumida, um conjunto de observações. (CERTO/ERRADO)
CERTO.
(CESPE/2015) O diretor de um sistema penitenciário, com o propósito de estimar o percentual de detentos que possuem filhos, entregou a um analista um cadastro com os nomes de 500 detentos da instituição para que esse profissional realizasse entrevistas com
os indivíduos selecionados. A partir dessa situação hipotética e dos múltiplos aspectos a
ela relacionados, julgue o item seguinte, referentes a técnicas de amostragem.
A diferença entre um censo e uma amostra consiste no fato de esta última exigir a realização de um número maior de entrevistas. (CERTO/ERRADO)
ERRADO.
A amostra busca um número menor de entrevistados, enquanto o Censo busca analisar
toda a população.
(UFU-MG/UFU-MG/TÉCNICO EM ESTATÍSTICA/2019) Considere as seguintes variáveis.
I – Tamanho de um objeto (pequeno, médio ou grande)
II – Volume de água em um rio
III – Número de clientes numa fila
IV – Número da seção de votação
V – Comprimento de um inseto
VI – Classe Social
Com relação à classificação dos dados requeridos como variáveis de pesquisa, é correto
afirmar que
a. as variáveis I, IV e VI são qualitativas.
b. as variáveis III e V são quantitativas contínuas.
c. as variáveis II e III são quantitativas discretas.
d. a variável IV é qualitativa ordinal.
LETRA A.
(CESPE) A tabela precedente apresenta a distribuição de frequências relativas da variável X, que representa o número diário de denúncias registradas na ouvidoria de determinada instituição pública. A partir das informações dessa tabela, julgue o item seguinte.
A variável X é do tipo qualitativo nominal. (CERTO/ERRADO)
ERRADO.
O número diário de denúncias registradas (X) marca uma variável quantitativa discreta.
(CESPE) A qualificação dos professores é de grande importância para a qualidade da formação
dos estudantes. Considerando que a figura acima apresenta a distribuição do número de
professores em uma faculdade, segundo a formação acadêmica (curso), julgue o item.
A variável curso é qualitativa nominal. (CERTO/ERRADO)
ERRADO.
O gráfico acima apresenta uma hierarquia em nível escolar. Logo, em se tratando de
hierarquia, temos, então, uma variável qualitativa ordinal.
(IBADE/PREFEITURA DE VILA VELHA – ES/ANALISTA PÚBLICO DE GESTÃO/ECONOMISTA/2020) Todas as informações obtidas através de dados amostrais, ou seja, que não abrangem o todo da população de interesse, são baseadas em estimativas. Quais das sentenças, abaixo enunciadas, concordam com a afirmativa?
I – nascimentos esperados para o ano em curso;
II – a média populacional da altura dos homens adultos;
III – número de óbitos do último exercício;
IV – quantidade de municípios que pagam o IPTU em dia;
V – alcance da última campanha de vacinação, realizada pelo município.
Estão corretas:
a. somente I, II e III.
b. somente II, III e IV.
c. somente III, IV e V.
d. somente I, II e V.
e. somente, II e IV
LETRA D.
I – nascimentos esperados para o ano em curso trata-se de uma estimativa.
II – a média populacional da altura dos homens adultos, por estar ao tempo todo em
movimento, trata-se de uma estimativa.
III – número de óbitos do último exercício não se trata de uma estimativa.
IV – quantidade de municípios que pagam o IPTU em dia não se trata de uma estimativa.
V – alcance da última campanha de vacinação, realizada pelo município, trata-se de uma
estimativa.
DISTRIBUIÇÃO DE FREQUÊNCIA
Distribuição de Frequência é uma representação tabular dos dados estatísticos, discretos
ou contínuos, sendo uma forma de resumir grandes conjuntos de dados. Dados representados em uma tabela de frequência facilitam a construção de gráficos, bem como a compreensão sobre a natureza dos dados.
Frequência Simples Absoluta (fi)
A frequência simples de um elemento é o número de vezes que o elemento figura no conjunto de dados. Para os dados discretos da amostra anterior, teremos a seguinte distribuição de frequência:
A variável (X1) é a quantidade de disciplinas cursadas pelos alunos.
O “n” representa a amostra e o total do Fi. O “n” é o mesmo que Σ (sigma), ou o somatório
do fi, representando por Σfi.
Frequência relativa (Fr)
É a razão entre a frequência absoluta da variável e o número total (n) de elementos da série.
Para compreender a Frequência relativa, basta dividir o “fi” pelo total (20). E para dispor
o resultado em porcentagem, é preciso apenas multiplicar o resultado por 100.
A frequência relativa apresenta o quanto determinado valor representa em relação ao total.
Frequência acumulada (Fac.)
Frequência acumulada é o somatório da frequência simples da variável com as frequências simples dos elementos que cedem.
Amplitude amostral
É a diferença entre o maior e o menor valor da amostra. Amplitude se remete a uma ideia
de distância. E para empreender a Amplitude, tomando como base X: {4, 8, 8, 6, 6, 8, 5, 5,
6, 7, 7, 7, 6, 6, 7, 5, 5, 7, 5, 5}, deve-se subtrair o maior valor (8) pelo menor valor (4). Logo,
Amplitude (A) = 8 - 4 = 4
(CESPE/TCE-PA/AUDITOR DE CONTROLE EXTERNO/ÁREA FISCALIZAÇÃO/ESTATÍSTICA/2017) A tabela precedente apresenta a distribuição de frequências relativas da variável X, que
representa o número diário de denúncias registradas na ouvidoria de determinada instituição pública. A partir das informações dessa tabela, julgue o item seguinte.
A amplitude total da amostra é igual ou superior a 5. (CERTO/ERRADO)
ERRADO.
A = maior valor – menor valor da amostra
A = 4 - 0
A = 4
(CESPE/CEBRASPE/DEPEN/AGENTE PENITENCIÁRIO FEDERAL/ÁREA 4/2015) Considerando dados da tabela mostrada, que apresenta a distribuição populacional da
quantidade diária de incidentes (N) em determinada penitenciária, julgue o item que se
segue.
A amplitude total da distribuição é igual a 5, pois há cinco valores possíveis para a variável N. (CERTO/ERRADO)
ERRADO.
A = maior valor – menor valor da amostra
A = 4 - 0
A = 4
Representação de dados em classes
Usado para as variáveis quantitativas que não são discretas, como, por exemplo, a análise do
peso de alunos de um determinado local.
Para dirimir as longas listas de representação dos valores quantitativos contínuos, torna-
-se preciso empreender os dados em classes, por meio de intervalos.
Imagine os seguintes intervalos, estimando o peso em Kg de alunos:
O valor a esquerda é fechado (inclui o número dentro da classe) e a direita é aberto (não inclui o número dentro da classe).
COMO CALCULAR O NUMERO DE CLASSES?
Revisitando, classe é cada um dos intervalos ou grupos obtidos a partir do conjunto de
dados. Há diversos métodos para se determinar o número de classes.
Digamos que nos deparemos em uma tabela com muitos valores, devemos, antes de
tudo, pensar quantas classes é preciso criar para empreender a resolução. Para tanto, torna-
-se necessário empreender regra do quadrado:
* Regra do quadrado: K = √n, em que n é o tamanho da amostra. Utiliza-se o valor mais
próximo do quadrado perfeito.
AMPLITUDE DA CLASSE
Amplitude da classe: na forma moderna, é a diferença entre os limites superior e inferior
da classe.
Para descobrir a amplitude da classe, basta empreender Ls - Li.
Na forma moderna, é a diferença entre os limites superior e inferior da2 classe.
Classe: Ls - Li
PONTO MÉDIO DA CLASSE
Ponto médio da classe (Pm)
É a média aritmética simples dos limites superior de cada classe.
PM = (Ls+Li)/2