Um gráfico de caixa e bigodes mostra o centro, a dispersão e uma possível assimetria de um conjunto de dados de forma rápida. Ele é construído a partir do resumo de cinco números: mínimo, primeiro quartil , mediana, terceiro quartil e máximo. Se a sua turma ou o seu software usa a regra de , os bigodes podem terminar nos valores não atípicos mais extremos, em vez do mínimo e do máximo absolutos.
A caixa vai de até , então ela contém os centrais dos dados. A linha dentro da caixa é a mediana. Os bigodes mostram até onde os dados se estendem além dessa metade central.
O que um gráfico de caixa e bigodes mostra
Um box plot ajuda você a responder três perguntas rápidas:
- Onde está o centro? Olhe para a mediana.
- Quão espalhada está a metade central? Olhe para a largura da caixa.
- As caudas estão equilibradas? Compare os dois bigodes.
A largura da caixa é o intervalo interquartil, ou . Um maior significa que a metade central dos dados está mais espalhada. Se um bigode for muito mais longo que o outro, os dados podem ser assimétricos nessa direção.
Muitos box plots também usam a regra de para marcar possíveis outliers. Nessa versão, os bigodes terminam nos valores não atípicos mais extremos. Por isso, dois box plots corretos para os mesmos dados podem parecer um pouco diferentes se usarem regras diferentes para os bigodes.
Exemplo resolvido: dos dados ao box plot
Use o conjunto de dados ordenado
Há valores, então a mediana é a média dos dois valores centrais:
Como há um número par de dados, divida a lista em duas metades iguais. A metade inferior é , então
A metade superior é , então
Isso dá o resumo de cinco números:
Agora calcule o intervalo interquartil:
Se você usar a regra comum de outliers , os limites são
e
Todos os valores dos dados ficam entre e , então não há possíveis outliers segundo essa regra. Para esse conjunto de dados, a caixa iria de até , a linha da mediana ficaria em e os bigodes chegariam a e .
Como ler um box plot rapidamente
Comece pela linha da mediana. Ela mostra onde está o centro dos dados.
Depois compare a largura da caixa com os comprimentos dos bigodes. A caixa mostra onde estão os centrais dos valores, enquanto os bigodes mostram até onde as caudas se estendem além dessa região.
Por fim, procure assimetria. Se a mediana estiver deslocada dentro da caixa, ou se um bigode for muito mais longo que o outro, a distribuição pode não estar equilibrada em torno do centro.
Erros comuns com gráficos de caixa e bigodes
Um erro comum é interpretar as bordas da caixa como o mínimo e o máximo. Normalmente, elas representam e , e não as extremidades do conjunto completo de dados.
Outro erro é supor que todo box plot usa a mesma regra para os bigodes. Alguns bigodes vão até o mínimo e o máximo. Outros terminam nos valores não atípicos mais extremos.
Também é fácil esquecer que os quartis dependem de dados ordenados. Se os valores não forem colocados em ordem primeiro, os quartis e a mediana estarão errados.
Quando os box plots são úteis
Gráficos de caixa e bigodes são úteis quando você quer um resumo rápido de uma distribuição em vez de uma lista completa de valores. Eles são comuns em aulas de estatística, resumos de experimentos, controle de qualidade e comparações entre grupos.
Eles são especialmente úteis quando outliers ou assimetria importam, porque a mediana e os quartis costumam ser mais estáveis do que a média sozinha.
Tente um conjunto de dados parecido
Pegue um conjunto curto de dados já ordenados, escreva seu resumo de cinco números e esboce a caixa antes de se preocupar com outliers. Se quiser conferir seus quartis e sua mediana em um problema parecido de estatística, tente sua própria versão em um solver depois de montar a lista ordenada por conta própria.
Precisa de ajuda com um problema?
Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.
Abrir GPAI Solver →