Tese de Doutoramento
Mean-field games: theory, numerics, and applications
2018
—Informações chave
Autores:
Orientadores:
Publicado em
07/12/2018
Resumo
Em sistemas dinâmicos com um número elevado de agentes, frequentemente fenómenos competitivos e cooperativos ocorrem quer em condições naturais quer devido a configurações projectadas. São disto exemplo sistemas de comunicações, fenómenos ambientais, biológicos, de transporte, comércio e energia. E estes sistemas têm por base muitos comportamentos económicos e financeiros. A análise de sistemas com elevado número de agentes, utilizando os métodos teóricos clássicos, como teoria de jogos de N-jogadores, é muitas vezes intratável. A teoria de jogos de campo-médio (JCM) foi desenvolvida para estudar esses sistemas dinâmicos, modelando-os como um continuum de agentes racionais que interagem de forma não cooperativa. Na primeira parte da tese, abordamos alguns aspectos teóricos e propomos uma definição de solução relaxada para JCM, que permite estabelecer unicidade de soluções com hipótese de regularidade mínimas. Também propomos um modelo de variações do preço de activos financeiros, que é uma modificação do problema do portfolio da Merton, onde consideramos que as transacções dos activos influenciam as suas cotações. Na segunda parte da tese, estudamos métodos numéricos para os JCM com número estados finitos que variam continuamente no tempo e que satisfazem uma condição de monotonicidade. Também desenvolvemosO métodos numéricos para JCM de primeira ordem dependente do tempo e com operadores não locais. Os JCP são determinados por um sistema de equações diferenciais com condições de fronteira inicial e terminal. Estas condições de fronteira não usuais dificultam a aproximação numérica do JCM por métodos clássicos existentes na literatura. Portanto, impõe-se a construção de novos métodos numéricos que sejam adaptados a esta classe de problemas. Neste trabalho, usando a condição de monotonicidade dos JCP, construímos um fluxo que provamos ser uma contracção e cujos pontos fixos são solução tanto de JCP estacionários como dependentes do tempo. Também desenvolvemos métodos numéricos para JCP com operadores não locais, utilizando para isso métodos de aproximação de Fourier para as soluções de sistemas de primeira ordem de JCP não-locais. Usando técnicas de expansão de Fourier, aproximamos o sistema de JCP por um sistema mais simples que é equivalente a um problema de optimização convexa sobre um subespaço de dimensão finita de curvas contínuas. Resolvemos este problema de optimização usando uma variante do método de gradiente híbrido primal-dual. Na terceira parte da tese, introduzimos um modelo dinâmico de formação de preços em que um grande número utilizadores pode armazenar e comercializar electricidade a partir de baterias conectadas à rede de distribuição eléctrica. O modelo que propomos é um JCP com restrições onde o preço é um multiplicador de Lagrange para a condição de balanço da procura versus oferta. Utilizando um argumento de ponto fixo, provamos também a existência de uma solução única. Por fim, estudamos modelos lineares com custo quadrático, em que obtemos soluções explícitas e descobrimos que o preço (dinânmico no tempo) depende linearmente do consumo agregado de energia instantâneo. In dynamical systems with a large number of agents, competitive, and cooperative phenomena occur in a broad range of designed and natural settings. Such as communications, environmental, biological, transportation, trading, and energy systems, and they underlie much economic and financial behavior. Analysis of such systems is intractable using the classical finite N-players game theoretic methods is often intractable. The mean-field games (MFG) framework was developed to study these large systems, modeling them as a continuum of rational agents that interact in a non-cooperative way. In this thesis, we address some theoretical aspects and propose a definition of relaxed solution for MFG that allows establishing uniqueness under minimal regularity hypothesis. We also propose a price impact model, that is a modification of the Merton’s portfolio problem where we consider that assets’ transactions influence their prices. We also study numerical methods for continuous time finite-state MFG that satisfy a monotonicity condition, and for time-dependent first-order nonlocal MFG. MFG is determined by a system of dierential equations with initial and terminal boundary conditions. These non-standard conditions make the numerical approximation of MFG dicult. Using the monotonicity condition, we build a flow that is a contraction and whose fixed points solve both for stationary and time-dependent MFG. We also develop Fourier approximation methods for the solutions of first-order nonlocal mean-field games systems. Using Fourier expansion techniques, we approximate a given MFG system by a simpler one that is equivalent to a convex optimization problem over a finite-dimensional subspace of continuous curves. We solve this problem using a variant of a primal-dual hybrid gradient method. Finally, we introduce a price-formation model where a large number of small players can store and trade electricity. Our model is a constrained MFG where the price is a Lagrange multiplier for the supply versus demand balance condition. We establish the existence of a unique solution using a fixed-point argument. Then, we study linear-quadratic models that hold specific solutions, and we find that the dynamic price depends linearly on the instant aggregated consumption.
Detalhes da publicação
Autores da comunidade :
Orientadores desta instituição:
RENATES TID
101607865
Designação
Doutoramento em Engenharia Electrotécnica e de Computadores
Domínio Científico (FOS)
electrical-engineering-electronic-engineering-information-engineering - Engenharia Eletrotécnica, Eletrónica e Informática
Palavras-chave
- Mean-field games
- dynamical systems
- optimal control
- numerical methods
- partial dierential equations
- stochastic dierential equations
- Jogos de campo–medio
- sistemas dinâmicos
- controlo optimo
- métodos numéricos
- equações diferenciais parciais
- equações diferenciais ordinárias
- equações diferenciais estocásticas
Idioma da publicação (código ISO)
eng - Inglês
Acesso à publicação:
Embargo levantado
Data do fim do embargo:
07/09/2019
Nome da instituição
Instituto Superior Técnico
Entidade financiadora da bolsa/projeto
Fundação para a Ciência e a Tecnologia