Teoria dos Jogos — Estratégia, Equilíbrio e Design de Mecanismos
Fundamentos de teoria dos jogos: equilíbrio de Nash, jogos cooperativos e não-cooperativos, dilema do prisioneiro, leilões, design de mecanismos e aplicações em mercados e tecnologia.
Teoria dos Jogos é o estudo matemático de situações estratégicas onde o resultado de cada participante depende não apenas de suas próprias escolhas, mas das escolhas dos demais. Desenvolvida por John von Neumann e Oskar Morgenstern nos anos 1940 e formalizada por John Nash em 1950, tornou-se ferramenta central em economia, ciência política, biologia evolutiva e, mais recentemente, computação e IA.
Papers de referência: arXiv econ.TH e cs.GT — Theoretical Economics / Computer Science and Game Theory
Conceitos fundamentais
Jogadores, estratégias e payoffs
Um jogo é formado por três elementos:
- Jogadores: quem toma decisões (pessoas, empresas, países, algoritmos)
- Estratégias: conjunto de ações disponíveis para cada jogador
- Payoffs: resultado (utilidade, lucro) de cada combinação de estratégias
Equilíbrio de Nash
O Equilíbrio de Nash é o ponto onde nenhum jogador consegue melhorar seu resultado mudando unilateralmente sua estratégia, dado o que os outros estão fazendo.
"Uma situação onde todo jogador está respondendo da melhor forma possível às escolhas dos demais." — John Nash, 1950
Propriedade fundamental: em todo jogo finito com informação completa, existe ao menos um equilíbrio de Nash (possivelmente em estratégias mistas).
John Nash recebeu o Nobel de Economia em 1994 por essa descoberta. A pesquisa publicada no arXiv por Eric Maskin demonstra como o equilíbrio de Nash é a base do design de mecanismos modernos.
O Dilema do Prisioneiro
O exemplo mais famoso da teoria dos jogos. Dois suspeitos são interrogados separadamente:
| B cala | B confessa | |
|---|---|---|
| A cala | A: -1, B: -1 | A: -10, B: 0 |
| A confessa | A: 0, B: -10 | A: -5, B: -5 |
Análise: independente do que B faça, A sempre se sai melhor confessando. Idem para B. Portanto, ambos confessam e ficam 5 anos presos — embora o resultado cooperativo (ambos calarem, -1 cada) fosse melhor para os dois.
Equilíbrio de Nash: (confessa, confessa) — mesmo não sendo Pareto-eficiente.
Implicações: explica por que a cooperação é difícil de sustentar sem mecanismos de enforcement — de corridas armamentistas a guerras de preços entre empresas.
Tipos de jogos
Jogos simultâneos vs sequenciais
| Tipo | Características | Conceito de solução |
|---|---|---|
| Simultâneo | Jogadores escolhem ao mesmo tempo | Equilíbrio de Nash |
| Sequencial | Um jogador age antes do outro | Equilíbrio perfeito em subjogos (backward induction) |
Jogos de soma zero vs soma não-zero
- Soma zero: o ganho de um é exatamente a perda do outro (xadrez, pôquer)
- Soma não-zero: possibilidade de ganhos mútuos ou perdas mútuas (dilema do prisioneiro, negociações)
Informação completa vs incompleta
- Informação completa: todos conhecem os payoffs de todos
- Informação incompleta: jogadores têm tipos privados (ex: uma empresa conhece seu custo, a outra não)
- Solução: Equilíbrio de Bayes-Nash — cada jogador maximiza utilidade esperada dado o que infere sobre os tipos dos outros
Backward Induction — jogos sequenciais
Em jogos sequenciais, resolve-se de trás para frente. Cada jogador antecipa as respostas futuras ao tomar decisões presentes.
Exemplo — Jogo da Entrada de Mercado:
- Entrante decide: entrar ou não
- Incumbente decide: guerra de preços ou acomodar
Resolvendo de trás:
- Se entrante entra → incumbente compara lucro com guerra vs acomodação
- Geralmente, guerra de preços é cara para ambos → incumbente acomoda
- Entrante antecipa isso → entra
Conclusão: ameaças de guerra de preços frequentemente não são críveis, o que sustenta a estratégia de entrada.
Estratégias Mistas
Quando não existe equilíbrio de Nash em estratégias puras, jogadores randomizam suas ações.
Exemplo — Pênalti no futebol:
- Cobrador escolhe: esquerda ou direita
- Goleiro escolhe: pular para esquerda ou direita
Nenhuma estratégia pura é equilíbrio (se goleiro sempre pula direita, cobrador chuta esquerda; se sempre esquerda, cobrador chuta direita). O equilíbrio exige randomização nas probabilidades que tornam o adversário indiferente.
Design de Mecanismos
Design de mecanismos é a engenharia reversa da teoria dos jogos: dado o resultado desejado, como desenhar as regras do jogo para que participantes auto-interessados o alcancem?
O Teorema da Revelação
O resultado central do design de mecanismos (Myerson, 1979 — Nobel 2007): qualquer resultado que pode ser implementado por um mecanismo complexo pode também ser implementado por um mecanismo direto e incentive-compatible onde é ótimo para cada agente revelar sua informação privada verdadeiramente.
Implicação: o designer pode, sem perda de generalidade, focar em mecanismos onde participantes revelam sua informação privada honestamente.
Aplicações práticas
| Contexto | Design de Mecanismo |
|---|---|
| Leilões governamentais | Espectro de rádio, concessões de petróleo |
| Matching markets | Residência médica (NRMP), vagas em escolas |
| Plataformas digitais | Leilões de anúncios (Google Ads, Meta Ads) |
| Blockchain | Protocolos DeFi, mecanismos de consenso |
| Procurement | Licitações públicas |
Teoria dos Leilões
Os quatro formatos principais
| Formato | Como funciona | Estratégia ótima |
|---|---|---|
| Inglês (ascendente) | Lances crescentes abertos | Lance até valor pessoal |
| Holandês (descendente) | Preço cai até alguém aceitar | Lance abaixo do valor pessoal |
| Primeiro preço (fechado) | Maior lance vence, paga o que ofertou | Lance abaixo do valor pessoal |
| Segundo preço (Vickrey) | Maior lance vence, paga o segundo maior | Lance o valor pessoal exato (dominante) |
Teorema da Equivalência de Receita
Em condições ideais (compradores simétricos, independentes, neutros ao risco), todos os quatro formatos de leilão geram a mesma receita esperada para o vendedor. Na prática, desvios dessas premissas (assimetria, aversão ao risco, correlação) quebram a equivalência.
Leilões de anúncios (VCG/GSP)
O Google e Meta usam variantes do leilão de Vickrey chamadas Generalized Second Price (GSP): anunciantes dão lances por posições, quem vence paga o lance do próximo competidor ajustado por relevância. Gera bilhões diariamente.
Jogos Repetidos e Cooperação
Quando o dilema do prisioneiro é jogado repetidamente, a cooperação pode emergir.
Folk Theorem: em jogos repetidos infinitamente (ou com probabilidade positiva de continuação), qualquer payoff Pareto-superior ao equilíbrio de Nash do jogo estático pode ser sustentado em equilíbrio com estratégias adequadas.
Tit-for-Tat: estratégia que começa cooperando e depois imita a última ação do adversário. Simples, clara, provocável e perdoadora — venceu torneios de Axelrod como a mais eficaz em dilemas do prisioneiro repetidos.
Teoria dos Jogos e IA
Nos últimos anos, teoria dos jogos e IA se cruzam intensamente:
- AlphaGo/AlphaZero: aprende estratégias de equilíbrio em jogos de soma zero
- Multi-agent RL: múltiplos agentes de RL interagindo — convergência para Nash é problema aberto
- LLMs e negociação: modelos de linguagem usados como jogadores em experimentos de teoria dos jogos
- Mecanismos algorítmicos: design automatizado de leilões via aprendizado de máquina
Conexões com outras seções
- Economia Comportamental — desafios empíricos às previsões racionais da teoria dos jogos
- Econometria — testa empiricamente previsões de equilíbrio com dados
- Arbitragem Estatística — estratégias de mercado com múltiplos agentes
- Aprendizado por Reforço — multi-agent RL e jogos competitivos
Referências:
- Nash equilibrium and mechanism design — E. Maskin (Harvard)
- The Nash equilibrium: A perspective — PNAS
- arXiv econ.TH — Theoretical Economics
Aviso Legal: Conteúdo educativo. Não constitui recomendação de investimento ou política econômica.
Econometria — Estatística Aplicada à Economia
Fundamentos de econometria: regressão linear e não-linear, séries temporais, dados em painel, causalidade e inferência estatística com aplicações econômicas.
Economia Comportamental — Vieses, Decisão e Nudges
Fundamentos de economia comportamental: Prospect Theory, vieses cognitivos, heurísticas, nudges e como humanos realmente tomam decisões sob incerteza.