Acceder

Regresión lineal múltiple

En este artículo vamos a ver que es la regresión lineal múltiple y para qué sirve, su fórmula, y como se calcula de forma sencilla. Para ello nos serviremos de un ejemplo práctico con la acción de Apple 

¿Qué es la regresión lineal múltiple?

 La regresión lineal múltiple es una extensión de la regresión lineal simple que permite examinar cómo múltiples variables independientes están relacionadas con una variable dependiente.

Regresión lineal múltiple
Regresión lineal múltiple


Siguiendo con el ejemplo de los helados que vimos en el artículo de regresión lineal simple, donde vimos cómo la temperatura podría afectar las ventas de helados, vamos a profundizar más allá y ver cómo otros factores adicionales pueden influir en la misma variable dependiente.

Es decir, podríamos añadir, por ejemplo, el número de turistas para que nos ayude a explicar cómo se comporta en función de más de una variable.

Fórmula de la regresión lineal múltiple

Siguiendo con nuestro ejemplo, además de la temperatura (variable independiente 1), podríamos querer investigar cómo el número de turistas (variable independiente 2) afectan las ventas de helados (variable dependiente).

La fórmula para un modelo de regresión múltiple es una extensión del modelo de regresión lineal simple:

Formula regresión lineal múltiple
Formula regresión lineal múltiple

Al haber muchas variables y por hacerlo sencillo, se utiliza b para la beta (o pendiente) y x para las variables independientes. Para identificarlas se les añade un subíndice que es el número que ves.

En nuestro ejemplo la ecuación podría ser:

Formula aplicada de la regresión lineal múltiple
Formula aplicada de la regresión lineal múltiple

Donde:
  • y: es el número de helados vendidos:
  • b0: es la intersección
  • b1: es el coeficiente de variación de x1 (temperatura) 
  • b2: es el coeficiente de variación de x2 (número de turistas en miles) 
  • y la especie de E: que hay al final es el error. 

Piensa que cuando hagamos nuestro cálculo esto no siempre coincidirá con la realidad observada, por lo que la diferencia entre la estimación y la realidad se conoce como error o residuo según el contexto en el que estemos trabajando.

Y ahora te estarás preguntando, ¿y cómo se calcula esto?


¿Cómo se calcula el modelo de regresión múltiple?

El proceso de cálculo para la regresión múltiple es conceptualmente similar al de la regresión simple, pero matemáticamente más complejo debido a la presencia de múltiples variables. A menudo se utiliza software estadístico avanzado como R, Python o incluso Excel para realizar estos cálculos.

  1. Se determinan las medias de las variables dependientes e independientes.

  2. Se calculan las covarianzas y varianzas para cada par de variables independientes y la dependiente.

  3. Se utilizan métodos como el de Mínimos Cuadrados Ordinarios (MCO) para estimar los coeficientes b que minimizan la suma de los cuadrados de los residuos (diferencia entre valores observados y predichos).

  4. Se evalúa la intercepción y los coeficientes obtenidos.

Dada su complejidad en el cálculo no entraremos en detalles, pero como hemos dicho anteriormente, la esencia es la misma y se puede calcular con cualquier software estadístico como R y Excel o incluso utilizando librerías estadísticas en Python.

¿Cómo se interpreta un modelo de regresión múltiple?

Eso sí, mucho más importante que los detalles del cálculo matemático, es la interpretación. Supongamos que después de calcular nuestro modelo de venta de helados diarios según la temperatura y según el número de turistas (en miles) que visitaron la ciudad ese día, tenemos lo siguiente:

¿Cómo se interpreta un modelo de regresión múltiple?
¿Cómo se interpreta un modelo de regresión múltiple?


Esto significa que, según nuestro modelo, si un día no hubiera ni temperatura ni turistas, se venderían 20 helados (lo cual es una situación poco realista y sirve solo para completar el modelo matemático). Por cada grado centígrado que aumenta la temperatura, se venden 3 helados adicionales, y por cada mil turistas adicionales que visita la ciudad, se venden 5 helados adicionales.

Ahora, imagina que queremos predecir cuántos helados se venderían un día que hace 30 grados y visitaron la ciudad 20.000 turistas.

¿Cómo se interpreta de forma aplicada un modelo de regresión múltiple?
¿Cómo se interpreta de forma aplicada un modelo de regresión múltiple?



Nuestra predicción en esas condiciones es que se venderán 210 helados ese día.

Ahora bien, es vital destacar que estos coeficientes vienen con supuestos que hemos asumido previamente. La interpretación está basada en el supuesto de que las otras variables permanecen constantes, lo que rara vez ocurre en la vida real. Por ejemplo, un aumento en la temperatura podría también atraer más turistas, y este modelo simplificado no captura esa interacción entre las variables independientes.

¿Cómo hacer una regresión lineal múltiple aplicada al trading? | Ejemplo práctico

En el mundo del trading, la regresión múltiple se utiliza habitualmente para analizar cómo diferentes factores económicos, así como bursátiles, afectan el precio de un activo. Por ejemplo, supongamos que queremos investigar cómo el precio de las acciones de Apple está influenciado por la venta de smartphone a nivel global, la inversión en I+D de la compañía y el tipo de cambio EUR/USD.

Lo primero que debemos comprobar siempre es si las variables que vamos a utilizar tienen sentido, así que vamos a ello:

  • Ventas globales de smartphones (x1): Representa la demanda global de smartphones, que podría influir directamente en los ingresos de Apple. Lo mediremos en cientos de millones de ventas. De manera que si el valor es 1, en realidad significará que se han vendido 100 millones, si el valor es 10, entonces 1.000 millones.

  • Inversión en I+D (x2): Indica cuánto está invirtiendo Apple en investigación y desarrollo, lo que podría afectar su innovación y, por ende, su valor en el mercado. Una unidad será igual a 1.000 millones.

Una vez explicadas las variables, tendremos una ecuación como la siguiente:

¿Cómo hacer una regresión lineal múltiple?
¿Cómo hacer una regresión lineal múltiple?

Donde:

  • APPLE es el precio de las acciones de Apple

  • b0 es la intersección

  • b1, b2 son los coeficientes para cada una de las variables descritas anteriormente.

  • E es el error

Con esto en mente, extraemos los datos, utilizamos nuestro software de cálculo estadístico y nos sale lo siguiente:
¿como hacer un modelo de regresion lineal multiple en excel?
¿como hacer un modelo de regresion lineal multiple en excel?


¿Cómo se interpreta?

Y bien, ¿cómo se interpreta esto? Vamos a ello:

  • Por cada 100 millones vendidos en las ventas globales de smartphones, el precio de las acciones de Apple aumenta en 2 dólares.
  • Por cada 1.000 millones adicionales que invierte Apple en I+D, el precio de las acciones aumenta en 5 dólares.

Ahora, imaginemos que estos datos son ciertos. Según los datos, Apple inviertió en 2022, la cifra de 26.000 millones en I+D y se vendieron 1.200 millones de smartphone a nivel global.


Si aplicamos esto a la ecucación, tendríamos que:



Recuerda que multiplicamos por 12, porque cada unidad equivale a 100 millones. Al venderse 1.200 millones, tenemos que multiplicar por 12. Algo similar ocurre en la inversión en I+D, cada unidad equivale a 1.000 millones, por lo que al ser 26.000 millones, debemos multiplicar por 26.

El resultado es que según esta estimación las acciones de Apple deberían tener un precio aproximado de 254 dólares por acción. Aquí tienes un gráfico en 3D de cómo cambiaría el precio según cada variable.

¿Para qué sirve la regresión lineal múltiple?

La regresión lineal múltiple es una herramienta estadística poderosa con una amplia gama de aplicaciones en diversos campos. En general, sirve para varios propósitos clave:

  1. Predicción: Permite estimar y predecir el valor de una variable dependiente basándose en las variaciones de dos o más variables independientes. Este modelo puede predecir resultados futuros a partir de datos existentes, lo que es esencial en áreas como la meteorología, la planificación financiera y la gestión de recursos.

  2. Inferencia Causal: Ayuda a entender las relaciones entre variables y a determinar el impacto de una o más variables independientes sobre una variable dependiente. Esto es crucial en campos como la economía, la sociología y la ciencia política, donde los investigadores están interesados en efectos causales.

  3. Control de variables confundentes: En estudios donde múltiples factores influyen en el resultado, la regresión lineal múltiple permite aislar el efecto de una variable ajustando por otras. Esto es importante en estudios médicos y sociales, donde variables confundentes pueden distorsionar las relaciones verdaderas.

  4. Optimización de procesos: En ingeniería y manufactura, la regresión puede utilizarse para optimizar procesos al entender cómo varias variables afectan un resultado de calidad o eficiencia.

Aplicación en Trading

En el ámbito del trading, la regresión lineal múltiple se utiliza para varios propósitos estratégicos y analíticos:

  1. Modelado de precios de activos: Los traders pueden usar la regresión para modelar cómo diversos factores económicos, financieros y de mercado afectan los precios de los activos. Por ejemplo, el precio de una acción podría depender de variables como las tasas de interés, el desempeño del sector, y indicadores económicos generales.

  2. Desarrollo de estrategias de trading cuantitativo: Los modelos de regresión pueden ayudar a identificar relaciones lineales entre diferentes activos financieros (como acciones y bonos) y usar estas relaciones para desarrollar estrategias de trading algorítmicas. Por ejemplo, un modelo podría señalar que ciertas combinaciones de variables indican un momento óptimo para comprar o vender un activo.

    De esta forma, una vez detectada la estrategia, podríamos aplicarla con un bot de sistema, conectado a la API KEY del broker, para ponerla a funcionar de forma autónoma en un proceso llamado trading automático

En definitiva, la regresión lineal múltiple nos sirva para averiguar, o al menos estimar como se comportará una variable que queremos conocer, en base a otras variables de las que depende. Y claro, estos modelos matemáticos tienen muchas aplicaciones prácticas; tecnología, medicina, y por supuesto, trading.

  • Comisiones en acciones y ETFs 0 %
  • Hasta 9 planes de inversión
  • Cuenta remunerada al 4,2%
 

¿Quieres referenciar esta definición?
Regresión lineal múltiple, Rookietrader, 19 de abril del '24, Rankia.com
Definiciones de por letra