(son los 2 fantasmas que explicaré luego)
La RN es algo vivo algo que va adaptándose a los nuevos datos y a las nuevas variables de entrada. Cada día(semana) voy añadiendo nuevas variables en un intento de mejorar la red. También le he añadido hace poco:
-El indicador (o algo parecido al) de Buffet (Market cap to GDP)
-El Log del VIX por proposición de @Nega16.
Algunas curiosidades: El PER es un buen predictor a largo plazo (10 años) del SP500:
... pero a 200 sesiones es un predictor bastante flojo. Ahora bien, sus variaciones (PER400, PER 200) son bastante mejores como predictores:
Una correlación muy baja, correlación tiene (-0.4), pero incluso negativa. Como inversor value, todo esto me ha sorprendido mucho. Cuanto múltiplos más caros menos tortazo.
Viendo que las correlaciones de FRED, PER200 y LogVIX son las más altas:
...A alguien se le puede ocurrir hacer un modelo solamente con estas 3 variables de partida. Por ejemplo FRED y LogVIX:
En esta grafica tenemos representadas las variables Log VIX y FRED. Los puntos naranjas son los "tortazos" y los azules son los "no tortazos". Además de que hay mucho ruido, se puede apreciar que en general cuanto más altas son estas variables, más probabilidad de tortazo. Otra forma de verlo es en suma suma combinada de ambos:
Nos sale 2 fantasmas, pero el azul(no tortazos), esta mas escorado hacia la izquierda, es decir, cuanto mas pequeños VIX y FRED menos tortazos.
Podemos hacerlo también con PER 400 y Log VIX:
También hay mucho ruido, pero se puede apreciar que en general cuanto mas alta es el Log VIX y menor el PER400, más probabilidad de tortazo.
Visto lo visto, se pueden combinar las 3 variables. Yo creo que si:
-Macroeconómicos: FRED, Cuanto % invierten en USA en renta variable (Link). Otro que es parecido al de Buffet (Market cap to GDP)
-Sentimiento de mercado: VIX(medida indirecta del miedo del mercado) y su logaritmo.
-Value:-PER y sus variaciones. Shiller PE, Aumento del PER...
-Price to sales (PS) y sus variaciones.
-Momentum y Técnicos: ruptura 200 sesiones, medias móviles, aceleración, momentum 200 sesiones...
Como ya hemos visto en otros posts estas variables tienen poca correlacion con la variable objetivo (tortazo del SP500). Predecir los tortazos del panadero es importante para reducir las perdidas de capital y tener cash cuando lleguen las oportunidades. Gracias a estas nuevas variables, los resultados de la red han mejorado un poco:
En general los aciertos no bajan del 78%. Los indicadores de Buffett y VIX mejoran bastante la RN, pero el problema de estos es que limitan la cantidad de observaciones (datos de partida).
En cuanto a la red Neuronal a nivel de programación, puedo deciros que lo he construido así:
Con 4 capas, con número de neuronas decreciente en cada capa y la última capa una sola neurona. Todo para evitar que sea demasiado (over fitting) compleja o demasiado simple (under fitting). Los resultados de salida tienen que estar entre 0 y 1, para eso la última activación es sigmoid (las demás pueden ser de otro tipo pe "relu").
En cuanto a la tabla de datos de partida es asi:
Unas 50 variables de entrada con datos desde 1928 (pero la mayoría de variables empieza a haber datos más tarde pe 1945). En total un máximo de 23.000 observaciones (sesiones de bolsa). He ido agregando variables sobre la marcha.
Ya me direis si tenéis más ideas!!