Big Data for Finance Project

Quinto encontro

2025-03-28

Objetivos de hoje

  • Mostrar a importância de compreendermos umm pouco sobre Modelos causais vs. modelos de Machine Learning (black-box) na previsão de séries temporais de preços de ativos financeiros. Comparação de performance de modelos.

  • Avançarmos na análise da performance básica do nosso portfólio selecionado (forneço um .qmd no Drive)

Agenda (to do de hoje)

  1. Introdução ao tema

  2. Modelos causais vs. Modelos de Machine Learning

    • Definições e conceitos
    • Aplicações práticas
    • Comparação de performance
  3. Apresentação do nosso .qmd para vocês adaptarem pra carteira de vocês e apresentarem com o Colab. Até a próxima sexta, vocês postam no site do grupo essa análise e apresentam.

  4. Grupos apresentam as análises obtidas com Colab em sala

Introdução ao tema

  • Importância da previsão precisa de séries temporais financeiras.
  • Diferenças fundamentais entre modelos interpretáveis (causais) e modelos "black-box" (machine learning).
  • Necessidade crescente de técnicas eficientes no contexto do Big Data Financeiro.

Referência inicial:

Varian, H. R. (2014). Big Data: New Tricks for Econometrics. Journal of Economic Perspectives, 28(2), 3–28.

Modelos causais: Definição e Conceitos

  • Enfatizam relações explícitas de causa e efeito.
  • Modelos comuns:
    • Modelos VAR estruturais (Vector AutoRegression)
    • Modelos ARDL (AutoRegressive Distributed Lag)
    • Modelos estruturais com equações simultâneas

Importância dos Modelos Causais

  • Interpretabilidade clara: Facilitam entender exatamente como variáveis econômicas e financeiras influenciam umas às outras.
  • Decisões baseadas em insights econômicos: Permitem políticas econômicas e estratégias financeiras direcionadas.
  • Robustez em mudanças estruturais: São mais resilientes frente a mudanças de contexto, regime econômico ou eventos inesperados, por possuírem embasamento econômico explícito.

Por que são mais úteis no contexto financeiro?

  • Decisões financeiras exigem clareza sobre os efeitos das ações tomadas.
  • Entender os mecanismos causais evita decisões baseadas em correlações espúrias.
  • A previsibilidade estrutural proporciona segurança adicional em períodos de alta volatilidade econômica.

Citação relevante:

Angrist, J., & Pischke, J. (2009). Mostly Harmless Econometrics: An Empiricist’s Companion. Princeton University Press.

Modelos de Machine Learning (black-box)

  • Baseiam-se em complexidade computacional, sem exigir uma estrutura causal explícita.
  • Exemplos típicos:
    • Redes Neurais Profundas (Deep Learning)
    • Random Forests
    • Gradient Boosting Machines (XGBoost, LightGBM)

Vantagens: - Alta capacidade preditiva. - Lida eficientemente com grandes volumes e alta dimensionalidade de dados.

Citação relevante:

Gu, S., Kelly, B., & Xiu, D. (2020). Empirical asset pricing via machine learning. The Review of Financial Studies, 33(5), 2223–2273.

Comparação de Performance

Critérios usuais de comparação:

  • Precisão de Previsão (RMSE, MAE)
  • Estabilidade temporal dos resultados
  • Capacidade de generalização (Out-of-sample)

Conclusões frequentes na literatura:

  • Modelos ML geralmente têm desempenho preditivo superior.
  • Modelos causais são preferidos quando interpretabilidade é crucial.

Artigo sugerido para referência:

Makridakis, S., Spiliotis, E., & Assimakopoulos, V. (2018). Statistical and Machine Learning forecasting methods: Concerns and ways forward. PloS One, 13(3).

Obrigado!

Rodrigo Hermont Ozon

\(\Rightarrow\) Agradecimentos à todos os alunos, futuros Data Scientists: