Teoria dos Jogos — Estratégia, Equilíbrio e Design de Mecanismos

Fundamentos de teoria dos jogos: equilíbrio de Nash, jogos cooperativos e não-cooperativos, dilema do prisioneiro, leilões, design de mecanismos e aplicações em mercados e tecnologia.

Teoria dos Jogos é o estudo matemático de situações estratégicas onde o resultado de cada participante depende não apenas de suas próprias escolhas, mas das escolhas dos demais. Desenvolvida por John von Neumann e Oskar Morgenstern nos anos 1940 e formalizada por John Nash em 1950, tornou-se ferramenta central em economia, ciência política, biologia evolutiva e, mais recentemente, computação e IA.

Papers de referência: arXiv econ.TH e cs.GT — Theoretical Economics / Computer Science and Game Theory

Conceitos fundamentais

Jogadores, estratégias e payoffs

Um jogo é formado por três elementos:

Jogadores: quem toma decisões (pessoas, empresas, países, algoritmos)
Estratégias: conjunto de ações disponíveis para cada jogador
Payoffs: resultado (utilidade, lucro) de cada combinação de estratégias

Equilíbrio de Nash

O Equilíbrio de Nash é o ponto onde nenhum jogador consegue melhorar seu resultado mudando unilateralmente sua estratégia, dado o que os outros estão fazendo.

"Uma situação onde todo jogador está respondendo da melhor forma possível às escolhas dos demais." — John Nash, 1950

Propriedade fundamental: em todo jogo finito com informação completa, existe ao menos um equilíbrio de Nash (possivelmente em estratégias mistas).

John Nash recebeu o Nobel de Economia em 1994 por essa descoberta. A pesquisa publicada no arXiv por Eric Maskin demonstra como o equilíbrio de Nash é a base do design de mecanismos modernos.

O Dilema do Prisioneiro

O exemplo mais famoso da teoria dos jogos. Dois suspeitos são interrogados separadamente:

	B cala	B confessa
A cala	A: -1, B: -1	A: -10, B: 0
A confessa	A: 0, B: -10	A: -5, B: -5

Análise: independente do que B faça, A sempre se sai melhor confessando. Idem para B. Portanto, ambos confessam e ficam 5 anos presos — embora o resultado cooperativo (ambos calarem, -1 cada) fosse melhor para os dois.

Equilíbrio de Nash: (confessa, confessa) — mesmo não sendo Pareto-eficiente.

Implicações: explica por que a cooperação é difícil de sustentar sem mecanismos de enforcement — de corridas armamentistas a guerras de preços entre empresas.

Tipos de jogos

Jogos simultâneos vs sequenciais

Tipo	Características	Conceito de solução
Simultâneo	Jogadores escolhem ao mesmo tempo	Equilíbrio de Nash
Sequencial	Um jogador age antes do outro	Equilíbrio perfeito em subjogos (backward induction)

Jogos de soma zero vs soma não-zero

Soma zero: o ganho de um é exatamente a perda do outro (xadrez, pôquer)
Soma não-zero: possibilidade de ganhos mútuos ou perdas mútuas (dilema do prisioneiro, negociações)

Informação completa vs incompleta

Informação completa: todos conhecem os payoffs de todos
Informação incompleta: jogadores têm tipos privados (ex: uma empresa conhece seu custo, a outra não)
- Solução: Equilíbrio de Bayes-Nash — cada jogador maximiza utilidade esperada dado o que infere sobre os tipos dos outros

Backward Induction — jogos sequenciais

Em jogos sequenciais, resolve-se de trás para frente. Cada jogador antecipa as respostas futuras ao tomar decisões presentes.

Exemplo — Jogo da Entrada de Mercado:

Entrante decide: entrar ou não
Incumbente decide: guerra de preços ou acomodar

Resolvendo de trás:

Se entrante entra → incumbente compara lucro com guerra vs acomodação
Geralmente, guerra de preços é cara para ambos → incumbente acomoda
Entrante antecipa isso → entra

Conclusão: ameaças de guerra de preços frequentemente não são críveis, o que sustenta a estratégia de entrada.

Estratégias Mistas

Quando não existe equilíbrio de Nash em estratégias puras, jogadores randomizam suas ações.

Exemplo — Pênalti no futebol:

Cobrador escolhe: esquerda ou direita
Goleiro escolhe: pular para esquerda ou direita

Nenhuma estratégia pura é equilíbrio (se goleiro sempre pula direita, cobrador chuta esquerda; se sempre esquerda, cobrador chuta direita). O equilíbrio exige randomização nas probabilidades que tornam o adversário indiferente.

Design de Mecanismos

Design de mecanismos é a engenharia reversa da teoria dos jogos: dado o resultado desejado, como desenhar as regras do jogo para que participantes auto-interessados o alcancem?

O Teorema da Revelação

O resultado central do design de mecanismos (Myerson, 1979 — Nobel 2007): qualquer resultado que pode ser implementado por um mecanismo complexo pode também ser implementado por um mecanismo direto e incentive-compatible onde é ótimo para cada agente revelar sua informação privada verdadeiramente.

Implicação: o designer pode, sem perda de generalidade, focar em mecanismos onde participantes revelam sua informação privada honestamente.

Aplicações práticas

Contexto	Design de Mecanismo
Leilões governamentais	Espectro de rádio, concessões de petróleo
Matching markets	Residência médica (NRMP), vagas em escolas
Plataformas digitais	Leilões de anúncios (Google Ads, Meta Ads)
Blockchain	Protocolos DeFi, mecanismos de consenso
Procurement	Licitações públicas

Teoria dos Leilões

Os quatro formatos principais

Formato	Como funciona	Estratégia ótima
Inglês (ascendente)	Lances crescentes abertos	Lance até valor pessoal
Holandês (descendente)	Preço cai até alguém aceitar	Lance abaixo do valor pessoal
Primeiro preço (fechado)	Maior lance vence, paga o que ofertou	Lance abaixo do valor pessoal
Segundo preço (Vickrey)	Maior lance vence, paga o segundo maior	Lance o valor pessoal exato (dominante)

Teorema da Equivalência de Receita

Em condições ideais (compradores simétricos, independentes, neutros ao risco), todos os quatro formatos de leilão geram a mesma receita esperada para o vendedor. Na prática, desvios dessas premissas (assimetria, aversão ao risco, correlação) quebram a equivalência.

Leilões de anúncios (VCG/GSP)

O Google e Meta usam variantes do leilão de Vickrey chamadas Generalized Second Price (GSP): anunciantes dão lances por posições, quem vence paga o lance do próximo competidor ajustado por relevância. Gera bilhões diariamente.

Jogos Repetidos e Cooperação

Quando o dilema do prisioneiro é jogado repetidamente, a cooperação pode emergir.

Folk Theorem: em jogos repetidos infinitamente (ou com probabilidade positiva de continuação), qualquer payoff Pareto-superior ao equilíbrio de Nash do jogo estático pode ser sustentado em equilíbrio com estratégias adequadas.

Tit-for-Tat: estratégia que começa cooperando e depois imita a última ação do adversário. Simples, clara, provocável e perdoadora — venceu torneios de Axelrod como a mais eficaz em dilemas do prisioneiro repetidos.

Teoria dos Jogos e IA

Nos últimos anos, teoria dos jogos e IA se cruzam intensamente:

AlphaGo/AlphaZero: aprende estratégias de equilíbrio em jogos de soma zero
Multi-agent RL: múltiplos agentes de RL interagindo — convergência para Nash é problema aberto
LLMs e negociação: modelos de linguagem usados como jogadores em experimentos de teoria dos jogos
Mecanismos algorítmicos: design automatizado de leilões via aprendizado de máquina

Conexões com outras seções

Economia Comportamental — desafios empíricos às previsões racionais da teoria dos jogos
Econometria — testa empiricamente previsões de equilíbrio com dados
Arbitragem Estatística — estratégias de mercado com múltiplos agentes
Aprendizado por Reforço — multi-agent RL e jogos competitivos

Referências:

Nash equilibrium and mechanism design — E. Maskin (Harvard)
The Nash equilibrium: A perspective — PNAS
arXiv econ.TH — Theoretical Economics

Aviso Legal: Conteúdo educativo. Não constitui recomendação de investimento ou política econômica.

Teoria dos Jogos — Estratégia, Equilíbrio e Design de Mecanismos

On this page