Heterocedasticidade

Heterocedasticidade — O que é, como detectar e como tratar | Dicionário de Estatística

Heterocedasticidade — o que é, como detectar e como tratar

Publicado em • Palavra-chave: Heterocedasticidade

Antes de começar, veja nosso curso sobre Distribuição Normal Essencial para Concurso.

Resumo rápido

Heterocedasticidade ocorre quando a variância dos erros de um modelo de regressão não é constante. Em termos simples: o “espalhamento” dos resíduos muda conforme os valores das variáveis explicativas. Isso viola um dos pressupostos clássicos da regressão linear e afeta especialmente os erros padrão e a validade dos testes estatísticos.

Por que a heterocedasticidade importa?

  • Os coeficientes OLS continuam não-viesados, mas os erros padrão ficam incorretos.
  • Testes t e intervalos de confiança tornam-se inválidos.
  • Se o objetivo é previsão, a variância do erro prevista também pode ser distorcida.

Causas comuns

  • Variância crescente ou decrescente com o valor de uma variável explicativa.
  • Modelo mal especificado (omissão de variáveis, forma funcional errada).
  • Grupos heterogêneos dentro do conjunto de dados.
  • Dados em escalas muito diferentes.

Como detectar: testes e diagnósticos gráficos

Maneiras práticas de detectar heterocedasticidade:

  1. Gráfico de resíduos vs. ajustados — padrão em funil é indício clássico.
  2. Teste de Breusch–Pagan — verifica se resíduos ao quadrado são explicados por variáveis do modelo.
  3. Teste de White — mais geral, inclui termos quadráticos e interações.
Se o p-valor do teste for pequeno (< 0,05), rejeita-se a hipótese de homocedasticidade.

Exemplo em R

# Ajuste de modelo
model <- lm(y ~ x1 + x2, data = df)

# Gráfico de resíduos
plot(model$fitted.values, residuals(model))

# Breusch-Pagan
library(lmtest)
bptest(model)

Exemplo em Python

import statsmodels.api as sm
from statsmodels.stats.diagnostic import het_breuschpagan

X = sm.add_constant(df[['x1','x2']])
y = df['y']
model = sm.OLS(y, X).fit()

# Breusch-Pagan
het_breuschpagan(model.resid, X)

Soluções e estratégias

As soluções mais usadas incluem:

  • Erros padrão robustos (HC3) — solução prática para inferência.
  • Transformações — log, raiz quadrada, etc.
  • WLS (Weighted Least Squares) — útil quando a estrutura da variância é conhecida.
  • Modelos de variância — como GARCH em séries temporais.

Erros padrão robustos em R

library(sandwich)
library(lmtest)
coeftest(model, vcov = vcovHC(model, type = "HC3"))

Erros padrão robustos em Python

model = sm.OLS(y, X).fit(cov_type='HC3')
print(model.summary())

Checklist para concursos

  1. Definição: variância não constante dos erros.
  2. Principais testes: Breusch–Pagan e White.
  3. Consequência: erros padrão incorretos.
  4. Soluções: robustos, transformação ou WLS.

Se gostou deste artigo sobre Heterocedasticidade, compartilhe e deixe seu comentário.

Tags: Heterocedasticidade, Regressão, Econometria, Erros Padrão

Comentários

Postagens mais visitadas deste blog

Box-plot Definição e Aplicação

Assimetria

Coeficiente de Variação: Comparando Variabilidade nos Dados