Kaique Mitsuo Silva Yamamoto
Economia

Teoria dos Jogos — Estratégia, Equilíbrio e Design de Mecanismos

Fundamentos de teoria dos jogos: equilíbrio de Nash, jogos cooperativos e não-cooperativos, dilema do prisioneiro, leilões, design de mecanismos e aplicações em mercados e tecnologia.

Teoria dos Jogos é o estudo matemático de situações estratégicas onde o resultado de cada participante depende não apenas de suas próprias escolhas, mas das escolhas dos demais. Desenvolvida por John von Neumann e Oskar Morgenstern nos anos 1940 e formalizada por John Nash em 1950, tornou-se ferramenta central em economia, ciência política, biologia evolutiva e, mais recentemente, computação e IA.

Papers de referência: arXiv econ.TH e cs.GT — Theoretical Economics / Computer Science and Game Theory


Conceitos fundamentais

Jogadores, estratégias e payoffs

Um jogo é formado por três elementos:

  • Jogadores: quem toma decisões (pessoas, empresas, países, algoritmos)
  • Estratégias: conjunto de ações disponíveis para cada jogador
  • Payoffs: resultado (utilidade, lucro) de cada combinação de estratégias

Equilíbrio de Nash

O Equilíbrio de Nash é o ponto onde nenhum jogador consegue melhorar seu resultado mudando unilateralmente sua estratégia, dado o que os outros estão fazendo.

"Uma situação onde todo jogador está respondendo da melhor forma possível às escolhas dos demais." — John Nash, 1950

Propriedade fundamental: em todo jogo finito com informação completa, existe ao menos um equilíbrio de Nash (possivelmente em estratégias mistas).

John Nash recebeu o Nobel de Economia em 1994 por essa descoberta. A pesquisa publicada no arXiv por Eric Maskin demonstra como o equilíbrio de Nash é a base do design de mecanismos modernos.


O Dilema do Prisioneiro

O exemplo mais famoso da teoria dos jogos. Dois suspeitos são interrogados separadamente:

B calaB confessa
A calaA: -1, B: -1A: -10, B: 0
A confessaA: 0, B: -10A: -5, B: -5

Análise: independente do que B faça, A sempre se sai melhor confessando. Idem para B. Portanto, ambos confessam e ficam 5 anos presos — embora o resultado cooperativo (ambos calarem, -1 cada) fosse melhor para os dois.

Equilíbrio de Nash: (confessa, confessa) — mesmo não sendo Pareto-eficiente.

Implicações: explica por que a cooperação é difícil de sustentar sem mecanismos de enforcement — de corridas armamentistas a guerras de preços entre empresas.


Tipos de jogos

Jogos simultâneos vs sequenciais

TipoCaracterísticasConceito de solução
SimultâneoJogadores escolhem ao mesmo tempoEquilíbrio de Nash
SequencialUm jogador age antes do outroEquilíbrio perfeito em subjogos (backward induction)

Jogos de soma zero vs soma não-zero

  • Soma zero: o ganho de um é exatamente a perda do outro (xadrez, pôquer)
  • Soma não-zero: possibilidade de ganhos mútuos ou perdas mútuas (dilema do prisioneiro, negociações)

Informação completa vs incompleta

  • Informação completa: todos conhecem os payoffs de todos
  • Informação incompleta: jogadores têm tipos privados (ex: uma empresa conhece seu custo, a outra não)
    • Solução: Equilíbrio de Bayes-Nash — cada jogador maximiza utilidade esperada dado o que infere sobre os tipos dos outros

Backward Induction — jogos sequenciais

Em jogos sequenciais, resolve-se de trás para frente. Cada jogador antecipa as respostas futuras ao tomar decisões presentes.

Exemplo — Jogo da Entrada de Mercado:

  1. Entrante decide: entrar ou não
  2. Incumbente decide: guerra de preços ou acomodar

Resolvendo de trás:

  • Se entrante entra → incumbente compara lucro com guerra vs acomodação
  • Geralmente, guerra de preços é cara para ambos → incumbente acomoda
  • Entrante antecipa isso → entra

Conclusão: ameaças de guerra de preços frequentemente não são críveis, o que sustenta a estratégia de entrada.


Estratégias Mistas

Quando não existe equilíbrio de Nash em estratégias puras, jogadores randomizam suas ações.

Exemplo — Pênalti no futebol:

  • Cobrador escolhe: esquerda ou direita
  • Goleiro escolhe: pular para esquerda ou direita

Nenhuma estratégia pura é equilíbrio (se goleiro sempre pula direita, cobrador chuta esquerda; se sempre esquerda, cobrador chuta direita). O equilíbrio exige randomização nas probabilidades que tornam o adversário indiferente.


Design de Mecanismos

Design de mecanismos é a engenharia reversa da teoria dos jogos: dado o resultado desejado, como desenhar as regras do jogo para que participantes auto-interessados o alcancem?

O Teorema da Revelação

O resultado central do design de mecanismos (Myerson, 1979 — Nobel 2007): qualquer resultado que pode ser implementado por um mecanismo complexo pode também ser implementado por um mecanismo direto e incentive-compatible onde é ótimo para cada agente revelar sua informação privada verdadeiramente.

Implicação: o designer pode, sem perda de generalidade, focar em mecanismos onde participantes revelam sua informação privada honestamente.

Aplicações práticas

ContextoDesign de Mecanismo
Leilões governamentaisEspectro de rádio, concessões de petróleo
Matching marketsResidência médica (NRMP), vagas em escolas
Plataformas digitaisLeilões de anúncios (Google Ads, Meta Ads)
BlockchainProtocolos DeFi, mecanismos de consenso
ProcurementLicitações públicas

Teoria dos Leilões

Os quatro formatos principais

FormatoComo funcionaEstratégia ótima
Inglês (ascendente)Lances crescentes abertosLance até valor pessoal
Holandês (descendente)Preço cai até alguém aceitarLance abaixo do valor pessoal
Primeiro preço (fechado)Maior lance vence, paga o que ofertouLance abaixo do valor pessoal
Segundo preço (Vickrey)Maior lance vence, paga o segundo maiorLance o valor pessoal exato (dominante)

Teorema da Equivalência de Receita

Em condições ideais (compradores simétricos, independentes, neutros ao risco), todos os quatro formatos de leilão geram a mesma receita esperada para o vendedor. Na prática, desvios dessas premissas (assimetria, aversão ao risco, correlação) quebram a equivalência.

Leilões de anúncios (VCG/GSP)

O Google e Meta usam variantes do leilão de Vickrey chamadas Generalized Second Price (GSP): anunciantes dão lances por posições, quem vence paga o lance do próximo competidor ajustado por relevância. Gera bilhões diariamente.


Jogos Repetidos e Cooperação

Quando o dilema do prisioneiro é jogado repetidamente, a cooperação pode emergir.

Folk Theorem: em jogos repetidos infinitamente (ou com probabilidade positiva de continuação), qualquer payoff Pareto-superior ao equilíbrio de Nash do jogo estático pode ser sustentado em equilíbrio com estratégias adequadas.

Tit-for-Tat: estratégia que começa cooperando e depois imita a última ação do adversário. Simples, clara, provocável e perdoadora — venceu torneios de Axelrod como a mais eficaz em dilemas do prisioneiro repetidos.


Teoria dos Jogos e IA

Nos últimos anos, teoria dos jogos e IA se cruzam intensamente:

  • AlphaGo/AlphaZero: aprende estratégias de equilíbrio em jogos de soma zero
  • Multi-agent RL: múltiplos agentes de RL interagindo — convergência para Nash é problema aberto
  • LLMs e negociação: modelos de linguagem usados como jogadores em experimentos de teoria dos jogos
  • Mecanismos algorítmicos: design automatizado de leilões via aprendizado de máquina

Conexões com outras seções


Referências:

Aviso Legal: Conteúdo educativo. Não constitui recomendação de investimento ou política econômica.

On this page