Os tipos de dados em estatística mostram o que uma variável representa. Se os valores são rótulos como "vermelho" ou "biologia", os dados são qualitativos. Se os valores são quantidades numéricas, os dados são quantitativos. Depois, para dados quantitativos, normalmente você faz mais uma pergunta: é uma contagem discreta ou uma medida contínua?
Isso importa porque o tipo de dado afeta quais gráficos, resumos e modelos fazem sentido. A média pode ajudar com alturas, mas não com cor dos olhos.
Dados qualitativos vs quantitativos
Dados qualitativos significam categorias
Dados qualitativos descrevem qualidades, grupos ou rótulos, e não quantidades numéricas. Exemplos incluem cor do carro, tipo sanguíneo e país.
Esse tipo de dado também é frequentemente chamado de dado categórico.
Dados quantitativos significam quantidades numéricas
Dados quantitativos registram uma quantidade numérica. O número não é apenas um rótulo; ele representa quanto, quantos ou quão longe.
Exemplos incluem idade, altura, nota de prova e número de animais de estimação.
Dados discretos vs contínuos
Dados discretos vêm de contagem
Dados discretos são dados quantitativos que geralmente vêm de contagem. Os valores saltam de um valor permitido para outro, em vez de preencher um intervalo inteiro.
O número de alunos em uma turma é discreto porque você conta alunos inteiros. Em um modelo comum de contagem, valores como alunos não fazem sentido.
Dados contínuos vêm de medição
Dados contínuos são dados quantitativos que geralmente vêm de medição. Em princípio, o valor pode ser registrado com precisão cada vez maior, dependendo do instrumento de medida e do contexto.
Altura, tempo e temperatura são exemplos clássicos. A altura de uma pessoa pode ser escrita como cm, cm ou cm, dependendo da precisão usada.
Exemplo resolvido: classificando dados de alunos
Suponha que uma escola registre estas quatro variáveis para cada aluno:
- turma
- número de irmãos
- tempo de deslocamento até a escola
- matéria favorita
Veja como classificá-las.
Turma é qualitativa porque é um rótulo de grupo.
Número de irmãos é quantitativa e discreta porque é uma contagem: e assim por diante.
Tempo de deslocamento até a escola é quantitativa e contínua porque é medido. Você pode arredondá-lo para o minuto mais próximo, mas a variável subjacente pode variar com mais precisão do que isso.
Matéria favorita é qualitativa porque nomeia uma categoria, não uma quantidade.
Este exemplo mostra o principal caminho de decisão. Primeiro pergunte: "rótulo ou quantidade?" Se for uma quantidade, pergunte: "contagem ou medição?"
Como identificar qual tipo de dado você tem
Use esta regra prática:
- Se calcular a média dos valores não fizer sentido, os dados provavelmente são qualitativos.
- Se calcular a média fizer sentido, os dados provavelmente são quantitativos.
- Se os valores quantitativos vêm da contagem de itens separados, eles geralmente são discretos.
- Se eles vêm de medição em uma escala, geralmente são contínuos.
Este é um atalho prático, não uma prova formal. O contexto da variável ainda importa.
Erros comuns com tipos de dados em estatística
Tratar códigos numéricos como quantidades reais
Se respostas de uma pesquisa forem codificadas como , e , esses números ainda podem representar categorias, e não quantidades reais. Um número nos dados não torna automaticamente a variável quantitativa.
Supor que todo valor inteiro é discreto
Uma medida registrada pode aparecer como número inteiro apenas porque foi arredondada. Por exemplo, pesos listados como , e quilogramas ainda são dados contínuos se o peso foi medido, e não contado.
Confundir a variável com a forma como ela é armazenada
Tempo de deslocamento arredondado para o minuto mais próximo costuma ser armazenado como número inteiro, mas a variável em si continua sendo contínua. O formato de registro nem sempre muda o tipo subjacente.
Onde esses tipos de dados são usados em estatística
A classificação importa sempre que você escolhe um gráfico, um resumo ou um método estatístico.
Para dados qualitativos, gráficos de barras e tabelas de frequência são comuns. Para dados quantitativos, histogramas, boxplots, médias, medianas e desvios padrão podem ser úteis.
A distinção entre discreto e contínuo também importa na escolha de um modelo de probabilidade. Alguns modelos são feitos para contagens, enquanto outros são feitos para medidas em um contínuo.
Tente sua própria versão
Pegue cinco variáveis do dia a dia, como número do calçado, CEP, temperatura, número de e-mails ou cor do cabelo, e classifique cada uma. Se algum caso parecer ambíguo, diga qual condição decide isso, como se o valor é um rótulo, uma contagem ou uma medição.
Se quiser ir um passo além, explore outro caso perguntando qual gráfico ou resumo faz sentido para cada variável e qual não faz.
Precisa de ajuda com um problema?
Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.
Abrir GPAI Solver →