Um gráfico de caixa e bigodes mostra o centro, a dispersão e uma possível assimetria de um conjunto de dados de forma rápida. Ele é construído a partir do resumo de cinco números: mínimo, primeiro quartil Q1Q_1, mediana, terceiro quartil Q3Q_3 e máximo. Se a sua turma ou o seu software usa a regra de 1.5×IQR1.5 \times IQR, os bigodes podem terminar nos valores não atípicos mais extremos, em vez do mínimo e do máximo absolutos.

A caixa vai de Q1Q_1 até Q3Q_3, então ela contém os 50%50\% centrais dos dados. A linha dentro da caixa é a mediana. Os bigodes mostram até onde os dados se estendem além dessa metade central.

O que um gráfico de caixa e bigodes mostra

Um box plot ajuda você a responder três perguntas rápidas:

  • Onde está o centro? Olhe para a mediana.
  • Quão espalhada está a metade central? Olhe para a largura da caixa.
  • As caudas estão equilibradas? Compare os dois bigodes.

A largura da caixa é o intervalo interquartil, ou IQR=Q3Q1IQR = Q_3 - Q_1. Um IQRIQR maior significa que a metade central dos dados está mais espalhada. Se um bigode for muito mais longo que o outro, os dados podem ser assimétricos nessa direção.

Muitos box plots também usam a regra de 1.5×IQR1.5 \times IQR para marcar possíveis outliers. Nessa versão, os bigodes terminam nos valores não atípicos mais extremos. Por isso, dois box plots corretos para os mesmos dados podem parecer um pouco diferentes se usarem regras diferentes para os bigodes.

Exemplo resolvido: dos dados ao box plot

Use o conjunto de dados ordenado

3, 5, 6, 7, 8, 9, 12, 153,\ 5,\ 6,\ 7,\ 8,\ 9,\ 12,\ 15

88 valores, então a mediana é a média dos dois valores centrais:

median=7+82=7.5\text{median} = \frac{7 + 8}{2} = 7.5

Como há um número par de dados, divida a lista em duas metades iguais. A metade inferior é 3,5,6,73, 5, 6, 7, então

Q1=5+62=5.5Q_1 = \frac{5 + 6}{2} = 5.5

A metade superior é 8,9,12,158, 9, 12, 15, então

Q3=9+122=10.5Q_3 = \frac{9 + 12}{2} = 10.5

Isso dá o resumo de cinco números:

min=3,Q1=5.5,median=7.5,Q3=10.5,max=15\text{min} = 3,\quad Q_1 = 5.5,\quad \text{median} = 7.5,\quad Q_3 = 10.5,\quad \text{max} = 15

Agora calcule o intervalo interquartil:

IQR=Q3Q1=10.55.5=5IQR = Q_3 - Q_1 = 10.5 - 5.5 = 5

Se você usar a regra comum de outliers 1.5×IQR1.5 \times IQR, os limites são

Q11.5(IQR)=5.57.5=2Q_1 - 1.5(IQR) = 5.5 - 7.5 = -2

e

Q3+1.5(IQR)=10.5+7.5=18Q_3 + 1.5(IQR) = 10.5 + 7.5 = 18

Todos os valores dos dados ficam entre 2-2 e 1818, então não há possíveis outliers segundo essa regra. Para esse conjunto de dados, a caixa iria de 5.55.5 até 10.510.5, a linha da mediana ficaria em 7.57.5 e os bigodes chegariam a 33 e 1515.

Como ler um box plot rapidamente

Comece pela linha da mediana. Ela mostra onde está o centro dos dados.

Depois compare a largura da caixa com os comprimentos dos bigodes. A caixa mostra onde estão os 50%50\% centrais dos valores, enquanto os bigodes mostram até onde as caudas se estendem além dessa região.

Por fim, procure assimetria. Se a mediana estiver deslocada dentro da caixa, ou se um bigode for muito mais longo que o outro, a distribuição pode não estar equilibrada em torno do centro.

Erros comuns com gráficos de caixa e bigodes

Um erro comum é interpretar as bordas da caixa como o mínimo e o máximo. Normalmente, elas representam Q1Q_1 e Q3Q_3, e não as extremidades do conjunto completo de dados.

Outro erro é supor que todo box plot usa a mesma regra para os bigodes. Alguns bigodes vão até o mínimo e o máximo. Outros terminam nos valores não atípicos mais extremos.

Também é fácil esquecer que os quartis dependem de dados ordenados. Se os valores não forem colocados em ordem primeiro, os quartis e a mediana estarão errados.

Quando os box plots são úteis

Gráficos de caixa e bigodes são úteis quando você quer um resumo rápido de uma distribuição em vez de uma lista completa de valores. Eles são comuns em aulas de estatística, resumos de experimentos, controle de qualidade e comparações entre grupos.

Eles são especialmente úteis quando outliers ou assimetria importam, porque a mediana e os quartis costumam ser mais estáveis do que a média sozinha.

Tente um conjunto de dados parecido

Pegue um conjunto curto de dados já ordenados, escreva seu resumo de cinco números e esboce a caixa antes de se preocupar com outliers. Se quiser conferir seus quartis e sua mediana em um problema parecido de estatística, tente sua própria versão em um solver depois de montar a lista ordenada por conta própria.

Precisa de ajuda com um problema?

Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.

Abrir GPAI Solver →