Prevendo a próxima década no mercado de ações em R
Fazer previsões precisas usando a grande quantidade de dados produzidos pelos mercados de ações e pela própria economia é difícil. Nesta publicação, examinaremos o desempenho de cinco modelos diferentes de aprendizado de máquina e preveremos os retornos futuros de dez anos para o S&P 500 usando bibliotecas de última geração, como caret, xgboostExplainer e patchwork.
Usaremos dados do Shiller, Goyal e BLS. Os dados de treinamento estão entre os anos de 1948 e 1991, e o conjunto de dados de teste é de 1991 e somente até 2009, porque a variável de destino está atrasada em dez anos.
Diferentes estratégias de investimento tendem a funcionar em momentos diferentes, e você deve esperar que a precisão do modelo que você está usando se mova em ciclos; às vezes a conexão com retornos é muito forte e, às vezes, muito fraca.
Estratégias de investimento em valor são um ótimo exemplo de estratégia que realmente não funcionou nos últimos doze anos (fonte, pdf). Correlações espúrias são outra causa de problemas, pois, por exemplo, duas ações podem se mover em conjunto por acaso. Isso destaca a necessidade de alguma seleção manual de recursos intuitivos.
Usaremos oito preditores diferentes; P/E, P/D, P/B, o índice CAPE, retorno total CAPE, inflação, taxa de desemprego e taxa de títulos do governo dos EUA em 10 anos. Todas as cinco medidas de avaliação são calculadas para todo o S&P 500. Vamos começar por inspecionar os agrupamentos de correlação dos diferentes preditores e o futuro retorno de dez anos (sem dividendos), que é usado como objetivo.
As diferentes medidas de avaliação estão fortemente correlacionadas entre si, conforme o esperado.
Todos esperam que P/B tenha uma correlação negativa muito forte com os retornos futuros de 10 anos. CAPE e retorno total CAPE, que é uma nova medida que considera também dividendos reinvestidos, estão fortemente correlacionados entre si. O retorno total do CAPE também está ligeiramente menos correlacionado com o retorno futuro de dez anos do que o CAPE normal.
Usaremos dados do Shiller, Goyal e BLS. Os dados de treinamento estão entre os anos de 1948 e 1991, e o conjunto de dados de teste é de 1991 e somente até 2009, porque a variável de destino está atrasada em dez anos.
Diferentes estratégias de investimento tendem a funcionar em momentos diferentes, e você deve esperar que a precisão do modelo que você está usando se mova em ciclos; às vezes a conexão com retornos é muito forte e, às vezes, muito fraca.
Estratégias de investimento em valor são um ótimo exemplo de estratégia que realmente não funcionou nos últimos doze anos (fonte, pdf). Correlações espúrias são outra causa de problemas, pois, por exemplo, duas ações podem se mover em conjunto por acaso. Isso destaca a necessidade de alguma seleção manual de recursos intuitivos.
Usaremos oito preditores diferentes; P/E, P/D, P/B, o índice CAPE, retorno total CAPE, inflação, taxa de desemprego e taxa de títulos do governo dos EUA em 10 anos. Todas as cinco medidas de avaliação são calculadas para todo o S&P 500. Vamos começar por inspecionar os agrupamentos de correlação dos diferentes preditores e o futuro retorno de dez anos (sem dividendos), que é usado como objetivo.
As diferentes medidas de avaliação estão fortemente correlacionadas entre si, conforme o esperado.
Todos esperam que P/B tenha uma correlação negativa muito forte com os retornos futuros de 10 anos. CAPE e retorno total CAPE, que é uma nova medida que considera também dividendos reinvestidos, estão fortemente correlacionados entre si. O retorno total do CAPE também está ligeiramente menos correlacionado com o retorno futuro de dez anos do que o CAPE normal.
Os modelos de Machine Learning
Primeiro, criaremos um modelo ingênuo que prevê que o retorno futuro seja o mesmo que o retorno médio no conjunto de treinamento. Depois de treinar os cinco modelos, também criaremos um modelo de conjunto para ver se ele pode alcançar uma precisão mais alta que qualquer um dos cinco modelos, o que geralmente é o caso.
Os modelos que vamos usar são bem diferentes um do outro. O modelo glmnet é exatamente como o modelo linear, exceto que reduz os coeficientes de acordo com uma penalidade para evitar ajustes excessivos. Portanto, possui uma flexibilidade muito baixa e também executa a seleção automática de recursos (exceto se o hiperparâmetro alfa for exatamente zero como na regressão de crista). K-vizinhos mais próximos faz suas previsões comparando a observação com observações semelhantes.
O MARS, por outro lado, leva em consideração as não linearidades nos dados e também considera as interações entre os recursos.
O XGBoost é um modelo de árvore, que também leva em consideração não linearidades e interações. No entanto, melhora cada árvore, construindo-a com base nos resíduos da árvore anterior (reforço), o que pode levar a melhores precisões. O MARS e o SVM (máquinas de vetores de suporte) são realmente flexíveis e, portanto, podem se superfigurar facilmente, especialmente se o tamanho dos dados for pequeno o suficiente. O modelo XGBoost também é bastante flexível, mas não se adapta facilmente, pois realiza regularização e remoção.
Finalmente, temos o modelo de conjunto que simplesmente fornece a média das previsões de todos os modelos. Os modelos de conjunto são uma estratégia bastante popular nas competições de aprendizado de máquina para alcançar precisões além da precisão de qualquer modelo único.
Os modelos serão construídos usando o empacotador de intercalação, e os hiperparâmetros ideais são escolhidos usando a divisão do tempo, que é uma técnica de validação cruzada adequada para séries temporais. Usaremos cinco timeslices para capturar o maior número possível de períodos, com observações suficientes em cada um deles.
A validação cruzada dos dados de treinamento consiste em 70% dos dados, mantendo os 30% restantes como um conjunto de testes. Os resultados são mostrados abaixo:
As previsões são menos precisas após a linha vermelha, que separa os conjuntos de treinamento e teste. O modelo não viu os dados no lado direito da linha; portanto, sua precisão pode ser pensada como um proxy para o desempenho do modelo no futuro.
Examinaremos a precisão do modelo no conjunto de testes usando duas medidas; erro absoluto médio (MAE) e R ao quadrado (R²). Os resultados são mostrados na tabela abaixo:
Os dois modelos mais flexíveis, MARS e SVM, se comportam de maneira selvagem no conjunto de testes e mostram sinais de super ajuste. Ambos têm erros absolutos médios que são cerca de duas vezes maiores quando comparados ao modelo ingênuo. Embora o MARS tenha um alto R ao quadrado, o erro absoluto médio é alto. É por isso que você não pode confiar no quadrado ao quadrado sozinho.
A Glmnet tem previsões bastante plausíveis até o ano de 2009, provavelmente devido ao rápido crescimento da relação P/L. Os vizinhos K mais próximos não reagiram muito aos dados, mas ainda alcançam um MAE bastante baixo. Fora dos modelos únicos, o XGBoost teve o melhor desempenho. O modelo de conjunto, no entanto, teve um desempenho ligeiramente melhor conforme medido pelo MAE. Também parece ser o modelo mais estável, o que é esperado, já que combina as previsões dos outros modelos.
Vamos ver as importâncias dos recursos. Eles são calculados de maneiras diferentes para os diferentes tipos de modelo, mas ainda devem ser comparáveis. A plotagem é feita usando a colcha de retalhos da biblioteca, que permite que a plotagem seja feita apenas adicionando as plotagens usando um sinal de adição.
Após uma inspeção mais minuciosa das importâncias dos recursos, vemos que o modelo MARS usa apenas a taxa CAPE como recurso, enquanto o restante dos modelos usa os recursos de maneira mais uniforme. A maioria dos modelos realiza algum tipo de seleção de recurso, que também pode ser vista no gráfico.
Previsões futuras
Por fim, preveremos os próximos dez anos no mercado de ações e compararemos as previsões dos diferentes modelos. Também examinaremos mais de perto o modelo único com melhor desempenho, o XGBoost, inspecionando a composição da previsão. Os valores atuais dos recursos são obtidos principalmente das fontes listadas no primeiro capítulo, mas também da Trading Economics e multpl.
O modelo MARS é o mais pessimista, com uma previsão de retorno fortemente negativa. O modelo, no entanto, não deve ser confiado demais, pois usa apenas uma variável e não se comporta bem nos dados de teste. O modelo XGBoost é surpreendentemente otimista, com uma previsão de quase nove por cento ao ano. A previsão do modelo de conjunto é bastante baixa, mas seria três pontos percentuais a mais sem o modelo MARS.
Vamos analisar o modelo XGBoost com mais detalhes usando a biblioteca xgboostExplainer. O gráfico resultante é um gráfico em cascata que mostra a composição de uma única previsão, neste caso o CAGR previsto (mais um) para os próximos dez anos. A alta taxa de CAPE reduz o CAGR previsto em sete pontos percentuais, mas a taxa P/B aumenta em seis pontos percentuais.
Isso ocorre porque o modelo contém interações entre as proporções CAPE e P/B. O efeito do nível da taxa de juros é apenas um pouco positivo em dois pontos percentuais, mas a alta relação P/E atualmente reduz-a novamente ao mesmo nível. O restante dos recursos tem um efeito muito pequeno na previsão.
O benefício de prever os retornos de um único mercado de ações se limita principalmente ao fato de que você pode ajustar suas expectativas para o futuro. No entanto, prever os retornos de várias bolsas de valores e investir naquelas com as maiores previsões de retorno é provavelmente uma estratégia muito lucrativa. Klement (2012) mostrou que o índice CAPE sozinho faz um bom trabalho ao prever os retornos dos diferentes mercados de ações. A adição de mais variáveis sensíveis ao modelo provavelmente tornará o modelo mais estável e talvez melhor na previsão do resultado.
O artigo foi traduzido do blog https://databasedinvesting.blogspot.com/.
O código para testes pode ser encontrado aqui.
Vamos analisar o modelo XGBoost com mais detalhes usando a biblioteca xgboostExplainer. O gráfico resultante é um gráfico em cascata que mostra a composição de uma única previsão, neste caso o CAGR previsto (mais um) para os próximos dez anos. A alta taxa de CAPE reduz o CAGR previsto em sete pontos percentuais, mas a taxa P/B aumenta em seis pontos percentuais.
Isso ocorre porque o modelo contém interações entre as proporções CAPE e P/B. O efeito do nível da taxa de juros é apenas um pouco positivo em dois pontos percentuais, mas a alta relação P/E atualmente reduz-a novamente ao mesmo nível. O restante dos recursos tem um efeito muito pequeno na previsão.
O benefício de prever os retornos de um único mercado de ações se limita principalmente ao fato de que você pode ajustar suas expectativas para o futuro. No entanto, prever os retornos de várias bolsas de valores e investir naquelas com as maiores previsões de retorno é provavelmente uma estratégia muito lucrativa. Klement (2012) mostrou que o índice CAPE sozinho faz um bom trabalho ao prever os retornos dos diferentes mercados de ações. A adição de mais variáveis sensíveis ao modelo provavelmente tornará o modelo mais estável e talvez melhor na previsão do resultado.
O artigo foi traduzido do blog https://databasedinvesting.blogspot.com/.
O código para testes pode ser encontrado aqui.
Nenhum comentário:
Postar um comentário