Econometria — Estatística Aplicada à Economia

Fundamentos de econometria: regressão linear e não-linear, séries temporais, dados em painel, causalidade e inferência estatística com aplicações econômicas.

Econometria é a disciplina que aplica métodos estatísticos e matemáticos para analisar dados econômicos. O objetivo central é quantificar relações entre variáveis — por exemplo: quanto uma mudança na taxa de juros afeta o PIB? Qual é o efeito de anos de educação sobre o salário?

Papers de referência: arXiv econ.EM — Econometrics

O problema fundamental da econometria

Diferente de experimentos controlados de laboratório, economistas raramente podem manipular variáveis diretamente. Se observamos que países com mais comércio exterior têm PIB maior, isso indica que comércio causa crescimento, ou que países ricos simplesmente tendem a comercializar mais?

Econometria é, em grande parte, a ciência de distinguir correlação de causalidade com dados observacionais.

1. Regressão Linear — o ponto de partida

A regressão linear estima a relação entre uma variável dependente (y) e uma ou mais variáveis independentes (x):

y = β₀ + β₁x₁ + β₂x₂ + ... + βₙxₙ + ε

Onde:

β₀: intercepto (valor de y quando x=0)
β₁...βₙ: coeficientes (efeito de cada x sobre y)
ε: erro (o que o modelo não explica)

Estimação por OLS (Mínimos Quadrados Ordinários)

O método OLS encontra os coeficientes que minimizam a soma dos erros ao quadrado. É o estimador linear não-viesado de menor variância quando as premissas do modelo se sustentam (teorema de Gauss-Markov).

Premissas da regressão clássica

Premissa	O que significa	Consequência se violada
Linearidade	Relação entre x e y é linear	Modelo enviesado
Exogeneidade	E(ε\|x) = 0 (sem omissão de variável)	Coeficientes inconsistentes
Homocedasticidade	Variância do erro constante	Erros padrão incorretos
Sem multicolinearidade perfeita	X's não são combinações lineares uns dos outros	Coeficientes indeterminados
Sem autocorrelação	Erros não correlacionados entre si	Inferência inválida

Interpretação dos coeficientes

salário = 1500 + 300 × anos_educação + 200 × experiência + ε

→ β₁ = 300: cada ano adicional de educação aumenta salário em R$300
→ β₂ = 200: cada ano de experiência aumenta salário em R$200

2. Inferência Causal

O problema da variável omitida

Se você regride salário sobre educação sem controlar por habilidade inata, o coeficiente da educação será enviesado — porque habilidade afeta tanto a propensão de se educar quanto o salário.

Modelo incorreto: salário = α + β × educação + ε
Modelo correto:   salário = α + β × educação + γ × habilidade + ε

Variáveis instrumentais (IV)

Quando não podemos observar todas as variáveis relevantes, buscamos um instrumento: uma variável que afeta x mas não afeta y diretamente.

Exemplo clássico: estudar o efeito da educação sobre salários usando a proximidade a universidades como instrumento. A distância afeta a propensão de estudar, mas não deveria afetar o salário diretamente.

Diferenças em diferenças (DiD)

Compara o antes e depois entre grupo tratado e grupo controle para isolar o efeito de uma política:

Efeito = (tratado_depois - tratado_antes) - (controle_depois - controle_antes)

Exemplo: avaliar o efeito de um aumento de salário mínimo em um estado comparando com estado vizinho que não fez o aumento.

Regression Discontinuity (RD)

Explora cortes arbitrários em regras para criar "experimentos naturais". Se alunos com nota ≥ 60 recebem bolsa, compara quem tirou 59 vs 61 — grupos muito similares exceto pelo tratamento.

3. Séries Temporais

Dados organizados no tempo têm propriedades especiais que violam premissas da regressão clássica.

Conceitos fundamentais

Estacionariedade: uma série é estacionária quando sua média, variância e autocovariância não mudam ao longo do tempo. A maioria das séries econômicas (PIB, preços) não é estacionária.

Raiz unitária: série que cresce/decresce indefinidamente, sem retornar a uma média. Testar com Augmented Dickey-Fuller (ADF).

Cointegração: duas séries não-estacionárias são cointegradas se uma combinação linear delas é estacionária. Implica equilíbrio de longo prazo.

Modelos de séries temporais

Modelo	Uso
AR(p) — Autoregressivo	Valor atual depende de p valores passados
MA(q) — Média Móvel	Valor atual depende de q erros passados
ARMA(p,q)	Combinação de AR e MA
ARIMA(p,d,q)	ARMA com diferenciação para tornar série estacionária
SARIMA	ARIMA com componente sazonal
VAR — Vector Autoregression	Múltiplas séries interdependentes
GARCH	Modelagem de volatilidade (variância condicional)

GARCH — modelando volatilidade

Desenvolvido por Bollerslev (1986), o GARCH(1,1) é o padrão para modelar volatilidade em finanças:

σ²ₜ = ω + α × ε²ₜ₋₁ + β × σ²ₜ₋₁

Onde:
- σ²ₜ: variância condicional hoje
- ε²ₜ₋₁: choque ao quadrado de ontem (notícias)
- σ²ₜ₋₁: variância de ontem (persistência)

Captura dois fenômenos observados em mercados financeiros: clustering de volatilidade (períodos calmos seguidos de períodos turbulentos) e reversão à média da volatilidade.

4. Dados em Painel

Combinam dimensão de tempo (T períodos) e corte transversal (N unidades — países, empresas, indivíduos).

Efeitos Fixos vs Efeitos Aleatórios

	Efeitos Fixos	Efeitos Aleatórios
O que controla	Características não observadas constantes no tempo	Assume que não-observáveis são não-correlacionados com x
Quando usar	Suspeita de correlação entre não-observáveis e regressores	Quando variação entre unidades é aleatória
Custo	Perde variáveis time-invariant	Premissa mais restritiva
Teste	Hausman test decide entre os dois	—

5. Ferramentas e Software

import statsmodels.api as sm
import pandas as pd

# Regressão OLS em Python
X = df[['educacao', 'experiencia']]
X = sm.add_constant(X)
y = df['salario']

modelo = sm.OLS(y, X).fit()
print(modelo.summary())
# → coeficientes, erros padrão, R², p-values, intervalos de confiança

# Em R — padrão acadêmico
modelo <- lm(salario ~ educacao + experiencia, data = df)
summary(modelo)

# Efeitos fixos com painel
library(plm)
modelo_fe <- plm(salario ~ educacao, data = painel, model = "within")

Conexões com outras seções

Inferência Bayesiana — alternativa ao framework frequentista da econometria clássica
Séries Temporais com ML — modelos de deep learning complementam ARIMA em previsão
Arbitragem Estatística — aplica cointegração para estratégias de trading
Teoria dos Jogos — complemento teórico para análise de mercados e leilões

Aviso Legal: Conteúdo educativo. Não constitui recomendação de investimento ou política econômica.

Econometria — Estatística Aplicada à Economia

On this page