As medidas de dispersão mostram o quanto um conjunto de dados está espalhado. As três medidas básicas são amplitude, variância e desvio padrão. A amplitude usa apenas os menores e maiores valores, a variância mede a distância quadrática média em relação à média, e o desvio padrão é a raiz quadrada da variância, então ele traz a dispersão de volta às unidades originais.

Se você quer um resumo rápido, use a amplitude para uma visão inicial, a variância para trabalhos estatísticos formais e o desvio padrão quando quiser uma medida de dispersão mais fácil de interpretar.

Amplitude, variância e desvio padrão em resumo

A amplitude é a distância entre o valor mínimo e o máximo:

range=maximumminimum\text{range} = \text{maximum} - \text{minimum}

Ela é rápida de calcular, mas usa apenas dois valores. Um único valor extremo pode alterá-la bastante.

A variância mede o quanto os valores tendem a ficar afastados da média depois que essas distâncias são elevadas ao quadrado.

Para uma população completa,

σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N}(x_i - \mu)^2

Para uma amostra usada para estimar uma população maior,

s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2

Use NN apenas quando seus dados forem toda a população de interesse. Use n1n-1 quando seus dados forem uma amostra de um grupo maior.

O desvio padrão é a raiz quadrada da variância:

σ=σ2\sigma = \sqrt{\sigma^2}

ou, para uma amostra,

s=s2s = \sqrt{s^2}

Como está nas unidades originais, o desvio padrão costuma ser mais fácil de interpretar do que a variância.

Exemplo resolvido: mesma amplitude, dispersão diferente

Compare estes dois conjuntos de dados:

  • Conjunto A: 2,5,5,5,82, 5, 5, 5, 8
  • Conjunto B: 2,2,5,8,82, 2, 5, 8, 8

Ambos têm o mesmo mínimo, o mesmo máximo e a mesma média.

Para cada conjunto,

range=82=6\text{range} = 8 - 2 = 6

e

mean=255=5\text{mean} = \frac{25}{5} = 5

Então, a amplitude sozinha diz que eles têm a mesma largura. Mas os valores estão distribuídos de forma diferente em torno da média.

Conjunto A

Os desvios em relação à média são

3, 0, 0, 0, 3-3,\ 0,\ 0,\ 0,\ 3

Elevando ao quadrado, obtemos

9, 0, 0, 0, 99,\ 0,\ 0,\ 0,\ 9

A soma dos desvios ao quadrado é 1818. Se tratarmos os dados como uma população,

σ2=185=3.6\sigma^2 = \frac{18}{5} = 3.6

e

σ=3.61.90\sigma = \sqrt{3.6} \approx 1.90

Conjunto B

Os desvios em relação à média são

3, 3, 0, 3, 3-3,\ -3,\ 0,\ 3,\ 3

Elevando ao quadrado, obtemos

9, 9, 0, 9, 99,\ 9,\ 0,\ 9,\ 9

A soma dos desvios ao quadrado é 3636, então

σ2=365=7.2\sigma^2 = \frac{36}{5} = 7.2

e

σ=7.22.68\sigma = \sqrt{7.2} \approx 2.68

Os dois conjuntos têm a mesma amplitude, mas o Conjunto B tem variância e desvio padrão maiores. Essa é a ideia principal: a amplitude olha apenas para as extremidades, enquanto a variância e o desvio padrão usam o conjunto de dados inteiro.

Erros comuns com medidas de dispersão

Um erro comum é supor que a mesma amplitude significa a mesma dispersão. O exemplo acima mostra por que isso é falso.

Outro erro é tratar a variância como se estivesse nas unidades originais. Não está. Se os dados estiverem em metros, a variância estará em metros quadrados.

Um terceiro erro é confundir as fórmulas de população e de amostra. O denominador correto depende da situação: use NN para uma população completa e n1n-1 para uma amostra.

Também ajuda lembrar que a variância e o desvio padrão são sensíveis a valores atípicos, porque grandes desvios são elevados ao quadrado antes da média.

Quando cada medida é útil

Use a amplitude quando quiser uma visão inicial rápida de quão amplos são os dados.

Use a variância quando precisar da medida de dispersão dentro de outros métodos estatísticos. Muitas fórmulas em probabilidade e estatística são construídas em torno da variância, mesmo quando os relatórios depois mostram o desvio padrão no lugar dela.

Use o desvio padrão quando quiser uma descrição prática da dispersão nas mesmas unidades dos dados. Em muitos resumos escolares e do mundo real, ele é a opção mais fácil de ler.

Tente um problema parecido

Monte dois conjuntos curtos de dados com a mesma média e a mesma amplitude e depois compare a variância e o desvio padrão deles. Se quiser dar o próximo passo, teste sua própria versão em um solver depois de resolver à mão.

Precisa de ajuda com um problema?

Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.

Abrir GPAI Solver →