O coeficiente de correlação normalmente se refere ao coeficiente de correlação de Pearson, escrito como . Ele mede a direção e a força de uma relação linear entre duas variáveis numéricas.
Se for positivo, as variáveis tendem a aumentar juntas. Se for negativo, uma tende a diminuir enquanto a outra aumenta. Se estiver perto de , o de Pearson está dizendo que há pouco padrão linear, não necessariamente ausência total de relação.
O de Pearson é mais útil quando os dados vêm em pares, as duas variáveis são numéricas e a tendência em linha reta é o padrão que você quer resumir.
O Que o Coeficiente de Correlação Mostra
O de Pearson é uma medida padronizada de como duas variáveis variam juntas. Para uma amostra de dados emparelhados, a fórmula é
O numerador é positivo quando as variáveis tendem a se mover na mesma direção e negativo quando tendem a se mover em direções opostas. O denominador reescala esse movimento conjunto usando a dispersão de cada variável.
Quando o de Pearson está definido, ele deve satisfazer
Se uma das variáveis não tiver variação nenhuma, o denominador se torna , então o de Pearson fica indefinido.
Como Interpretar Valores Positivos, Negativos e Próximos de Zero
Comece pelo sinal:
- : associação linear positiva
- : associação linear negativa
- : ausência de associação linear
Depois observe o módulo . Valores mais próximos de significam que os pontos ficam mais próximos de um padrão em linha reta. Valores mais próximos de significam que o padrão linear é mais fraco.
Tenha cuidado com rótulos como "fraca", "moderada" ou "forte". Esses cortes dependem do contexto. Em uma área, pode ser importante. Em outra, pode ser pequeno demais para sustentar uma decisão.
O hábito mais seguro é interpretar junto com um gráfico de dispersão. O número é um resumo do padrão que você vê; ele não deve substituir a figura.
Exemplo Resolvido: Calculando
Suponha que os dados emparelhados sejam
Primeiro, calcule as médias:
Agora liste os desvios em relação às médias:
- Para :
- Para :
Multiplique os desvios emparelhados e some:
Agora calcule as duas somas de quadrados:
Então,
Isso mostra que há uma forte associação linear positiva nessa amostra. À medida que aumenta, geralmente também aumenta, e os pontos ficariam relativamente próximos de uma reta crescente.
Erros Comuns ao Interpretar Correlação
Tratar Correlação como Causalidade
Uma correlação alta não prova que uma variável causa a outra. Um terceiro fator pode influenciar ambas, ou a relação pode ser apenas coincidência nos dados observados.
Esquecer que o de Pearson é Linear
O de Pearson só mede bem associação linear. Uma relação curva pode produzir uma correlação pequena mesmo quando as variáveis estão claramente relacionadas.
Ignorar Outliers
Um único ponto incomum pode alterar bastante o valor de . Se o gráfico de dispersão tiver um outlier, a correlação pode contar uma história enganosa sobre o padrão geral.
Usar o de Pearson Quando o Contexto Não se Encaixa
O de Pearson foi feito para dados numéricos emparelhados e associação linear. Se uma variável for categórica, ou se o padrão for claramente curvo, esse coeficiente pode não responder à pergunta que realmente importa.
Interpretar Demais um Valor Próximo de Zero
Um valor próximo de significa "pouca associação linear", não "nenhuma relação de qualquer tipo".
Quando o Coeficiente de Correlação de Pearson é Usado
O de Pearson é muito usado em estatística, ciência, economia, pesquisa social e aprendizado de máquina como um resumo rápido de dados numéricos emparelhados. Ele é mais útil quando você quer saber se existe um padrão em linha reta antes de passar para um modelo como a regressão linear.
Na prática, um gráfico de dispersão deve vir primeiro. O coeficiente é um resumo, não um substituto para olhar os dados.
Tente um Problema Parecido
Pegue um pequeno conjunto de dados que você já entenda, faça o gráfico dos pontos e estime se a tendência parece positiva, negativa ou pouco clara antes de calcular . Essa comparação rápida é uma das formas mais eficientes de desenvolver intuição sobre o que o coeficiente de correlação realmente está dizendo.
Se quiser ir um passo além, explore os mesmos dados com uma reta de regressão linear simples. Isso facilita ver como correlação e previsão estão relacionadas, mas não são a mesma coisa.
Precisa de ajuda com um problema?
Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.
Abrir GPAI Solver →