As medidas de dispersão mostram o quanto um conjunto de dados está espalhado. As três medidas básicas são amplitude, variância e desvio padrão. A amplitude usa apenas os menores e maiores valores, a variância mede a distância quadrática média em relação à média, e o desvio padrão é a raiz quadrada da variância, então ele traz a dispersão de volta às unidades originais.
Se você quer um resumo rápido, use a amplitude para uma visão inicial, a variância para trabalhos estatísticos formais e o desvio padrão quando quiser uma medida de dispersão mais fácil de interpretar.
Amplitude, variância e desvio padrão em resumo
A amplitude é a distância entre o valor mínimo e o máximo:
Ela é rápida de calcular, mas usa apenas dois valores. Um único valor extremo pode alterá-la bastante.
A variância mede o quanto os valores tendem a ficar afastados da média depois que essas distâncias são elevadas ao quadrado.
Para uma população completa,
Para uma amostra usada para estimar uma população maior,
Use apenas quando seus dados forem toda a população de interesse. Use quando seus dados forem uma amostra de um grupo maior.
O desvio padrão é a raiz quadrada da variância:
ou, para uma amostra,
Como está nas unidades originais, o desvio padrão costuma ser mais fácil de interpretar do que a variância.
Exemplo resolvido: mesma amplitude, dispersão diferente
Compare estes dois conjuntos de dados:
- Conjunto A:
- Conjunto B:
Ambos têm o mesmo mínimo, o mesmo máximo e a mesma média.
Para cada conjunto,
e
Então, a amplitude sozinha diz que eles têm a mesma largura. Mas os valores estão distribuídos de forma diferente em torno da média.
Conjunto A
Os desvios em relação à média são
Elevando ao quadrado, obtemos
A soma dos desvios ao quadrado é . Se tratarmos os dados como uma população,
e
Conjunto B
Os desvios em relação à média são
Elevando ao quadrado, obtemos
A soma dos desvios ao quadrado é , então
e
Os dois conjuntos têm a mesma amplitude, mas o Conjunto B tem variância e desvio padrão maiores. Essa é a ideia principal: a amplitude olha apenas para as extremidades, enquanto a variância e o desvio padrão usam o conjunto de dados inteiro.
Erros comuns com medidas de dispersão
Um erro comum é supor que a mesma amplitude significa a mesma dispersão. O exemplo acima mostra por que isso é falso.
Outro erro é tratar a variância como se estivesse nas unidades originais. Não está. Se os dados estiverem em metros, a variância estará em metros quadrados.
Um terceiro erro é confundir as fórmulas de população e de amostra. O denominador correto depende da situação: use para uma população completa e para uma amostra.
Também ajuda lembrar que a variância e o desvio padrão são sensíveis a valores atípicos, porque grandes desvios são elevados ao quadrado antes da média.
Quando cada medida é útil
Use a amplitude quando quiser uma visão inicial rápida de quão amplos são os dados.
Use a variância quando precisar da medida de dispersão dentro de outros métodos estatísticos. Muitas fórmulas em probabilidade e estatística são construídas em torno da variância, mesmo quando os relatórios depois mostram o desvio padrão no lugar dela.
Use o desvio padrão quando quiser uma descrição prática da dispersão nas mesmas unidades dos dados. Em muitos resumos escolares e do mundo real, ele é a opção mais fácil de ler.
Tente um problema parecido
Monte dois conjuntos curtos de dados com a mesma média e a mesma amplitude e depois compare a variância e o desvio padrão deles. Se quiser dar o próximo passo, teste sua própria versão em um solver depois de resolver à mão.
Precisa de ajuda com um problema?
Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.
Abrir GPAI Solver →