Econometria — Estatística Aplicada à Economia
Fundamentos de econometria: regressão linear e não-linear, séries temporais, dados em painel, causalidade e inferência estatística com aplicações econômicas.
Econometria é a disciplina que aplica métodos estatísticos e matemáticos para analisar dados econômicos. O objetivo central é quantificar relações entre variáveis — por exemplo: quanto uma mudança na taxa de juros afeta o PIB? Qual é o efeito de anos de educação sobre o salário?
Papers de referência: arXiv econ.EM — Econometrics
O problema fundamental da econometria
Diferente de experimentos controlados de laboratório, economistas raramente podem manipular variáveis diretamente. Se observamos que países com mais comércio exterior têm PIB maior, isso indica que comércio causa crescimento, ou que países ricos simplesmente tendem a comercializar mais?
Econometria é, em grande parte, a ciência de distinguir correlação de causalidade com dados observacionais.
1. Regressão Linear — o ponto de partida
A regressão linear estima a relação entre uma variável dependente (y) e uma ou mais variáveis independentes (x):
y = β₀ + β₁x₁ + β₂x₂ + ... + βₙxₙ + εOnde:
- β₀: intercepto (valor de y quando x=0)
- β₁...βₙ: coeficientes (efeito de cada x sobre y)
- ε: erro (o que o modelo não explica)
Estimação por OLS (Mínimos Quadrados Ordinários)
O método OLS encontra os coeficientes que minimizam a soma dos erros ao quadrado. É o estimador linear não-viesado de menor variância quando as premissas do modelo se sustentam (teorema de Gauss-Markov).
Premissas da regressão clássica
| Premissa | O que significa | Consequência se violada |
|---|---|---|
| Linearidade | Relação entre x e y é linear | Modelo enviesado |
| Exogeneidade | E(ε|x) = 0 (sem omissão de variável) | Coeficientes inconsistentes |
| Homocedasticidade | Variância do erro constante | Erros padrão incorretos |
| Sem multicolinearidade perfeita | X's não são combinações lineares uns dos outros | Coeficientes indeterminados |
| Sem autocorrelação | Erros não correlacionados entre si | Inferência inválida |
Interpretação dos coeficientes
salário = 1500 + 300 × anos_educação + 200 × experiência + ε
→ β₁ = 300: cada ano adicional de educação aumenta salário em R$300
→ β₂ = 200: cada ano de experiência aumenta salário em R$2002. Inferência Causal
O problema da variável omitida
Se você regride salário sobre educação sem controlar por habilidade inata, o coeficiente da educação será enviesado — porque habilidade afeta tanto a propensão de se educar quanto o salário.
Modelo incorreto: salário = α + β × educação + ε
Modelo correto: salário = α + β × educação + γ × habilidade + εVariáveis instrumentais (IV)
Quando não podemos observar todas as variáveis relevantes, buscamos um instrumento: uma variável que afeta x mas não afeta y diretamente.
Exemplo clássico: estudar o efeito da educação sobre salários usando a proximidade a universidades como instrumento. A distância afeta a propensão de estudar, mas não deveria afetar o salário diretamente.
Diferenças em diferenças (DiD)
Compara o antes e depois entre grupo tratado e grupo controle para isolar o efeito de uma política:
Efeito = (tratado_depois - tratado_antes) - (controle_depois - controle_antes)Exemplo: avaliar o efeito de um aumento de salário mínimo em um estado comparando com estado vizinho que não fez o aumento.
Regression Discontinuity (RD)
Explora cortes arbitrários em regras para criar "experimentos naturais". Se alunos com nota ≥ 60 recebem bolsa, compara quem tirou 59 vs 61 — grupos muito similares exceto pelo tratamento.
3. Séries Temporais
Dados organizados no tempo têm propriedades especiais que violam premissas da regressão clássica.
Conceitos fundamentais
Estacionariedade: uma série é estacionária quando sua média, variância e autocovariância não mudam ao longo do tempo. A maioria das séries econômicas (PIB, preços) não é estacionária.
Raiz unitária: série que cresce/decresce indefinidamente, sem retornar a uma média. Testar com Augmented Dickey-Fuller (ADF).
Cointegração: duas séries não-estacionárias são cointegradas se uma combinação linear delas é estacionária. Implica equilíbrio de longo prazo.
Modelos de séries temporais
| Modelo | Uso |
|---|---|
| AR(p) — Autoregressivo | Valor atual depende de p valores passados |
| MA(q) — Média Móvel | Valor atual depende de q erros passados |
| ARMA(p,q) | Combinação de AR e MA |
| ARIMA(p,d,q) | ARMA com diferenciação para tornar série estacionária |
| SARIMA | ARIMA com componente sazonal |
| VAR — Vector Autoregression | Múltiplas séries interdependentes |
| GARCH | Modelagem de volatilidade (variância condicional) |
GARCH — modelando volatilidade
Desenvolvido por Bollerslev (1986), o GARCH(1,1) é o padrão para modelar volatilidade em finanças:
σ²ₜ = ω + α × ε²ₜ₋₁ + β × σ²ₜ₋₁
Onde:
- σ²ₜ: variância condicional hoje
- ε²ₜ₋₁: choque ao quadrado de ontem (notícias)
- σ²ₜ₋₁: variância de ontem (persistência)Captura dois fenômenos observados em mercados financeiros: clustering de volatilidade (períodos calmos seguidos de períodos turbulentos) e reversão à média da volatilidade.
4. Dados em Painel
Combinam dimensão de tempo (T períodos) e corte transversal (N unidades — países, empresas, indivíduos).
Efeitos Fixos vs Efeitos Aleatórios
| Efeitos Fixos | Efeitos Aleatórios | |
|---|---|---|
| O que controla | Características não observadas constantes no tempo | Assume que não-observáveis são não-correlacionados com x |
| Quando usar | Suspeita de correlação entre não-observáveis e regressores | Quando variação entre unidades é aleatória |
| Custo | Perde variáveis time-invariant | Premissa mais restritiva |
| Teste | Hausman test decide entre os dois | — |
5. Ferramentas e Software
import statsmodels.api as sm
import pandas as pd
# Regressão OLS em Python
X = df[['educacao', 'experiencia']]
X = sm.add_constant(X)
y = df['salario']
modelo = sm.OLS(y, X).fit()
print(modelo.summary())
# → coeficientes, erros padrão, R², p-values, intervalos de confiança# Em R — padrão acadêmico
modelo <- lm(salario ~ educacao + experiencia, data = df)
summary(modelo)
# Efeitos fixos com painel
library(plm)
modelo_fe <- plm(salario ~ educacao, data = painel, model = "within")Conexões com outras seções
- Inferência Bayesiana — alternativa ao framework frequentista da econometria clássica
- Séries Temporais com ML — modelos de deep learning complementam ARIMA em previsão
- Arbitragem Estatística — aplica cointegração para estratégias de trading
- Teoria dos Jogos — complemento teórico para análise de mercados e leilões
Aviso Legal: Conteúdo educativo. Não constitui recomendação de investimento ou política econômica.
Economia — Fundamentos, Modelos e Aplicações
Hub de economia baseado em pesquisa acadêmica: econometria, teoria dos jogos, mecanismos de mercado e economia comportamental.
Teoria dos Jogos — Estratégia, Equilíbrio e Design de Mecanismos
Fundamentos de teoria dos jogos: equilíbrio de Nash, jogos cooperativos e não-cooperativos, dilema do prisioneiro, leilões, design de mecanismos e aplicações em mercados e tecnologia.