Gráfico de dispersão — correlação, reta de melhor ajuste e exemplos

Um gráfico de dispersão mostra a relação entre duas variáveis numéricas. Cada ponto representa um par de valores, então você pode ver rapidamente se os dados sobem, descem, se espalham, formam grupos ou contêm pontos incomuns.

Isso faz do gráfico de dispersão a forma mais rápida de responder à pergunta que a maioria dos estudantes realmente tem: "O que está acontecendo nesses dados?" Antes de calcular a correlação ou traçar uma reta de melhor ajuste, o gráfico mostra se esses resumos sequer fazem sentido.

Como ler um gráfico de dispersão

O eixo horizontal mostra uma variável e o eixo vertical mostra a outra. Se um aluno estudou por $4$ horas e tirou $78$ , o ponto é $(4,78)$ .

Depois que os pontos estão no gráfico, procure o padrão geral:

Correlação positiva: os pontos tendem a subir da esquerda para a direita.
Correlação negativa: os pontos tendem a descer da esquerda para a direita.
Pouca ou nenhuma correlação clara: os pontos não mostram uma tendência linear forte.

Também observe agrupamentos, lacunas e valores atípicos. Dados reais quase nunca caem exatamente sobre uma única reta, então o objetivo é enxergar a tendência, não um alinhamento perfeito.

O que significa correlação em um gráfico de dispersão

Correlação descreve a direção e a força de uma relação linear. "Linear" é a condição principal: a correlação resume o quanto os pontos seguem uma tendência em linha reta.

Se os pontos se agrupam em torno de uma reta crescente, a correlação é positiva. Se se agrupam em torno de uma reta decrescente, a correlação é negativa. Se os pontos parecem espalhados, sem uma direção reta clara, a correlação linear é fraca ou próxima de zero.

Um padrão curvo ainda pode mostrar uma relação real. Só pode não ter uma correlação linear forte.

Quando uma reta de melhor ajuste ajuda

Uma reta de melhor ajuste é uma linha reta traçada para representar a tendência geral dos pontos. Ela não precisa passar por todos os pontos. Seu papel é ficar, no geral, próxima da nuvem de pontos.

Use uma reta de melhor ajuste apenas quando o gráfico de dispersão for aproximadamente linear. Nesse caso, a reta ajuda em duas coisas:

resumir a tendência
fazer previsões aproximadas dentro do intervalo observado

Se o padrão for curvo, dividido em grupos ou dominado por valores atípicos, uma reta de melhor ajuste pode esconder mais do que explica.

Exemplo de gráfico de dispersão: horas de estudo e notas de quiz

Suponha que um professor registre o tempo de estudo e a nota de um quiz de cinco alunos:

(1,55),\ (2,61),\ (3,68),\ (4,74),\ (5,81)

Esses pontos sobem da esquerda para a direita e ficam relativamente próximos de uma reta. Isso significa que a relação é positiva e aproximadamente linear.

Então, tanto a correlação quanto uma reta de melhor ajuste são resumos razoáveis aqui. Você esperaria que a reta de melhor ajuste tivesse inclinação positiva, porque tempos de estudo maiores tendem a vir com notas maiores no quiz.

Agora adicione um ponto extra em $(5,40)$ . A tendência ainda pode ser positiva, mas esse ponto é um valor atípico e pode puxar a reta de melhor ajuste para baixo. É por isso que o gráfico deve vir antes do resumo: a imagem mostra se o resumo é confiável.

Erros comuns em gráficos de dispersão

Tratar correlação como causalidade

Se duas variáveis se movem juntas, isso não significa automaticamente que uma causa a outra. Um terceiro fator pode afetar ambas, ou o padrão pode ser mais complicado do que parece à primeira vista.

Forçar uma reta em um padrão curvo

Alguns dados seguem uma curva em vez de uma linha reta. Nesse caso, uma reta de melhor ajuste linear pode dar um resumo enganoso.

Ignorar valores atípicos

Um único ponto incomum pode mudar bastante a tendência aparente. Valores atípicos nem sempre significam que os dados estão errados, mas nunca devem ser ignorados sem verificar o contexto.

Esquecer o que um ponto representa

Um gráfico de dispersão só funciona para dados pareados. Cada ponto deve vir de uma observação que tenha tanto um valor de $x$ quanto um valor de $y$ .

Quando gráficos de dispersão são usados

Gráficos de dispersão são usados em estatística, ciência, negócios e pesquisa social sempre que você quer comparar duas variáveis numéricas. Exemplos comuns incluem altura e peso, gasto com publicidade e vendas, ou tempo de estudo e nota na prova.

Eles são especialmente úteis no início de uma análise porque podem revelar padrões que uma única fórmula pode esconder, como agrupamentos, lacunas ou valores atípicos.

Tente um problema parecido

Pegue um pequeno conjunto de dados pareados e esboce os pontos antes de calcular a correlação. Faça três perguntas: o padrão sobe ou desce, parece aproximadamente linear e há pontos incomumente distantes dos demais?

Se o padrão parecer aproximadamente linear, explore os mesmos dados com um coeficiente de correlação ou uma reta de melhor ajuste simples. Esse é o próximo passo natural da imagem para o resumo.

Precisa de ajuda com um problema?

Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.

Abrir GPAI Solver →