En una clase de una facultad tenemos 8 personas que miden 170 cms, una persona que mide 150 cms y una persona que mide 190 cms. Cualquiera puede echar las cuentas y entender que la altura media, (y la mediana) son 170 cms.
Ahora imaginemos que alguien trata de hacer cualquier tipo de estimación o predicción sobre este caso; Por ejemplo, podemos plantear los siguientes ejercicios:
Si escogemos una persona al azar de la clase, ¿Cuánto creemos que medirá?.
Una persona va a entrar en la clase: ¿Si tiene que hacer una estimación sobre la altura que tendrá, que número daría?.
Es evidente que este ejemplo está perfectamente diseñado para que exista una solución lógica. Puede que se entienda como una trampa, pero en realidad lo que hace una exageración es mostrar mucho más claramente limitaciones al uso de la econometría.
En el caso en que nos obliguen a escoger un alumno de la clase, nadie en su sano juicio estimará que esta persona va a medir otra cosa que 170 cms, porque simplemente es lo más probable. Por tanto, un modelo econométrico o estadístico jamás nos va a proporcionar un resultado extremo, porque por sistema parte de tratar de adivinar lo más probable, entendiendo que estamos hablando de dispersiones estadísticas que siempre estarán en los sitios centrales.
Por otra parte, cuando respondemos a la pregunta de ¿Qué altura va a tener el próximo alumno que entre?, nos encontraremos otra vez con la misma respuesta, con una fuente de error adicional. Es decir, estimaremos siempre el caso normal, (nadie estimará el caso más excepcional), pero asumiendo como hipótesis que las personas de fuera del aula siguen la misma distribución que las personas de dentro. Si nos damos cuenta, lo que estamos haciendo es una predicción, en la que asumiremos que el futuro será como el pasado, pero teniendo en cuenta que descartaremos los sucesos extremos o improbables del pasado.
Estos dos aspectos, (y alguno más), son claves para entender de una forma sencilla, alguna cuestión que se plantea con cierta regularidad. En particular una de ellas es aquella de “¿El PIB está manipulado?”. Existen muchos ámbitos en los que se afirma que el PIB está manipulado, ya que no refleja la realidad de la caída brutal a la que estamos asistiendo. En mi opinión el PIB no tiene más manipulación que determinados cambios metodológicos que han servido para lavar un poco la cara, (por ejemplo el introducir los servicios financieros lo cual ha afectado a la medida, como expliqué en su día).
Pero sin embargo, el mayor problema para entender que el PIB no recoge la magnitud de la caída, es que con frecuencia olvidamos que no es más que un modelo econométrico. Es decir, el PIB, por mucho que se venda como un número no es una contabilización del producto del país, sino que es el resultado de un modelo econométrico, o lo que es lo mismo; el número que nos dan cada tres meses no es otra cosa más que la estimación del PIB.
Para que nos entendamos es la respuesta a la pregunta de antes: ¿Qué altura tiene la persona que hemos elegido?. Hemos sacado una persona al azar y hago la pregunta; supongo que todo el mundo me dirá: “probablemente mide 170 cms”; Pues esto es el PIB; la respuesta a una estimación, que evidentemente no es la realidad. Si nosotros comprobamos después la altura real del alumno que hemos señalado, podremos acertar o no. Resulta que si hubiésemos señalado al alumno de 190 cms, hubiésemos minusvalorado la altura; pero ¿y si no comprobamos la altura real de la persona?. Pues tendremos un dato que es una estimación, pero que jamás tomaríamos como cierto.
Pero lo importante es que este dato no caerá tanto como la realidad, (y no subirá tanto como la realidad), porque directamente es un modelo econométrico que por definición lo que hace es operar en base a las medias.
Es así de simple. Además en el PIB tenemos un punto adicional a tener en cuenta. El PIB no es tan sólo un número en un día, sino que son varios datos; (las famosas revisiones del PIB). Aparte de ser una estimación, normalmente únicamente se tiene en cuenta el PIB según se publica, que por definición es la primera estimación.
Como todas las estimaciones que se realizan, las primeras son siempre peores. Según va transcurriendo el tiempo, se van obteniendo más datos para realizar las estimaciones, de forma que a mayores datos, mayor fiabilidad. Pero aparte de que la calidad del dato inicial es peor por sistema, en la situación actual, también nos da un sesgo que debemos tener en cuenta.
El primer dato del PIB es el resultado de una ecuación en la que se meten los primeros datos disponibles. Los primeros datos disponibles son aquellos referidos a las grandes empresas y en consecuencia, la correlación de resultados de grandes empresas y primer dato del PIB es mucho mayor que en el resto de los casos. (o dicho de otra forma, el primer dato de PIB es el que más se parece a la evolución de las grandes empresas).
Es fácil entender que en un entorno en el que las grandes empresas no son las principales víctimas de la crisis, lo que tendremos es que el primer dato será una estimación de la producción basado en los datos de aquellos agentes económicos que mejor se están comportando en esta situación, (en base principalmente a que son los destinatarios de todas las medidas).
En consecuencia, es sencillo entender que es completamente lógico y normal que el PIB no recoja el dramatismo de la situación, sin que esto signifique que esté manipulado. Es así, porque para bien o para mal es PIB es lo que es y se comporta de una forma determinada que es muy coherente con los datos que estamos teniendo.
Y ya de paso me gustaría explicar un pequeño defecto en las previsiones de PIB, basadas en modelos econométricos. En particular estaríamos hablando de aquello de adivinar cuánto va a medir el próximo alumno; En definitiva, cuando hacemos estas previsiones y por definición el resultado de la formula tenderá hacia la media de las posibilidades y jamás a un extremo