Cuando observamos una gráfica y un pronóstico, y nos hablan de nivel de confianza, error de estimación, tendencias, sesgo y otras cosas, normalmente decimos: "Vamos al grano, ¿subirá o bajará?" y delegamos en otros el análisis de la metodología que hay detrás. ¿Por qué importa tanto la metodología? Es que la estadística tiene sus reglas y hay maneras correctas y maneras equivocadas de hacer las cosas, que no son evidentes para el observador casual.
Dice un dicho que "hay mentiras, grandes mentiras, y hay estadísticas". Este dicho se deriva del uso incorrecto, malintencionado o tendencioso de la estadística. La incapacidad para pronosticar la crisis también vino de un mal uso de la estadística que provoca problema de sesgo.
Comprendiendo el sesgo
Cuando decimos que una persona tiene "una visión sesgada de las cosas" nos referimos a una distorsión en la percepción o algo que evita que no se vean las cosas apropiadamente. En estadística, el sesgo es algo similar. El sesgo en estadística se refiere al "error direccional de un estimador". El estimador es una estimación de una medida o indicador que afecta a toda la población, siendo que tomamos una muestra de una parte de la población. Las muestras se toman porque suele ser muy caro recolectar todos los datos de una población completa, lo cual significa que trabajamos con datos incompletos, sólo una parte de los datos que existen. El sesgo estadístico es un error que no se puede corregir al repetir el experimento muchas veces y promediando los resultados.
La estadística existe para que con datos de una muestra podamos intentar concluir algo acerca de todos los elementos de una población. Cuando no actuamos con rigor metodológico, en lugar de un muestreo para obtener un estimador poblacional, lo que tenemos es un simple sondeo, que no necesariamente representa a toda la población, y sólo se puede sacar conclusiones sobre los datos sondeados, sin extender esas conclusiones más allá de esos datos y elementos.
¿Alguna vez has escuchado el término del "cisne negro" para escribir lo que se señala como crisis "poco comunes"? Bueno, en primer lugar ni son tan poco comunes como crees, ni tampoco son impredecibles como hacen creer los financieros. ¿Por qué crees que nadie, excepto unos pocos como el famoso economista Roubini conocido como "doctor Doom", anticipó la crisis? Para ver el origen de todo el problema debemos remitirnos al concepto de sesgo.
El sesgo que tengamos, y su procedencia es lo que nos debería indicar si los datos sirven para algo, o si son simples números inservibles. Si has de sacar conclusiones de las que va a depender tu dinero, probablemente no vas a querer tomar este tema del sesgo a la ligera.
Existen varios tipos de sesgo:
- Sesgo en la selección de muestras hace que saquemos conclusiones equivocadas porque no escogimos las muestras con rigor estadístico
- Sesgo de espectro viene de cuando la muestra está sesgada y sacamos conclusiones sobre una población a partir de una muestra no representativa.
- Sesgo de un estimador es la diferencia entre el estimador obtenido y el valor real de la población.
- Sesgo de omisión de variable es cuando el modelo omite una variable independiente que debería estar incluida.
- Sesgo sistemático o sesgo sistémico es el que proviene de influencias externas, donde el error mismo tiene una tendencia estadística. Puede deberse a problemas de sistemas no humanos (equipos de medición, modelos matemáticos, por ejemplo), o errores humanos deliberados o no.
- Sesgo de data-snooping es el que viene del mal uso de técnicas de minería de datos.
Podríamos también clasificar los tipos de sesgo en 3 categorías:
- Sesgo cognitivo viene de errores sistemáticos procedentes de factores cognitivos en vez de venir de la evidencia. Suelen ser el resultado de atajos en procesamiento de información llamados "heurística". Se incluyen errores de juicio, atribuciones sociales, y la memoria.
- Sesgo inductivo se aplica a un algoritmo que aprende, donde hay una colección de supuestos que el que aprende usa para predecir salidas, dadas entradas que no ha encontrado.
- Sesgo estadístico es el sesgo propio de los métodos estadísticos, como vimos antes.
Los sesgos cognitivos se pueden clasificar en:
- Sesgos conductuales y de toma de decisiones. Más detalles aquí.
- Sesgo por errores de concepción, donde existen ideas fallidas, engañosas, ideologías, creencia común y que los hechos muestran como incorrectas. Más detalles aquí. La verdad no es democrática, no responde a lo que creen las mayorías.
- Falacias. Consiste en usar procesos equivocados que llevan a conclusiones ilógicas, falsas y equivocadas. Más detalles aquí.
- Sesgos de memoria. Más detalles aquí.
Errores de los economistas neoclásicos
Quizá uno de los ejemplos más claros de un mamarracho teórico lleno de sesgos, es la economía neoclásica, más comparable con una secta, un culto religioso-matemático que con una ciencia social como la muy respetable economía.
¿Alguna vez te has preguntado por qué los economistas neoclásicos con sus fabulosos modelos y simulaciones no lograron predecir la crisis? La economía es una ciencia social, es decir, es una ciencia antropocéntrica que estudia al ser humano y sus actividades. La economía no es una ciencia "dinerocéntrica". El "dinerocentrismo" no es otra cosa que la "dinerología" (numerología del dinero) que pertenece al mundo de las finanzas, que estudian el dinero. Resulta que el dinero es el resultado de las actividades humanas, y estudiar al dinero sin estudiar a las personas es un error.
Daniel Kahnemann demostró que el ser humano no tiene una conducta aleatoria. Y como la estadística estudia fenómenos aleatorios, no sirve para estudiar al ser humano. ¿Qué hicieron los economistas neoclásicos? Eliminaron al ser humano de la ecuación y se dedicaron a estudiar el dinero, a desarrollar modelos puramente cuantitativos y muy complejos, construidos como un castillo de naipes lleno de sesgo en su base. Ese modelo no sufre mucho con variaciones pequeñas, pero como se basa en concepciones erradas y llenas de prejuicios, no logran detectar los cisnes negros, los eventos raros que no han sido tan raros en la historia humana. Su modelo funcionaba bien en el planeta de las finanzas, pero no en la Tierra.
Los economistas neoclásicos alegaban que la economía debería ser una "ciencia exacta" (Economic science must become an exact science, V. Nemchinov). En su artículo "Anatomy of a Crisis", George Soros refuta esta idea, al indicar que "la teoría económica se ha modelado a sí misma sobre la física teórica. Se ha visto estableciendo leyes válidas atemporales que gobiernan la conducta económica y que puede ser usadas reversiblemente para explicar y para predecir eventos. Pero en vez de encontrar leyes capaces de ser demostradas como falsas por medio de pruebas, la economía se ha ido convirtiendo en una disciplina axiomática que consiste en supuestos y deducciones matemáticas - similar a la geometría euclidiana".
En pocas palabras, los economistas neoclásicos querían convertir la economía en "economía sin humanos", una ciencia exacta que no necesita demostrarse o probarse, a pesar de estar basada en supuestos. Imaginemos que uno de los supuestos es el de que Tierra es plana. ¿Que tipo de sesgos están implícitos en un supuesto?
Los sesgos implícitos en los complicados modelos de simulación de los neoclásicos no son tan evidentes. Por un lado asumen como independientes variables que son interdependientes, lo cual les facilita el uso de distribuciones de probabilidad crudas y uso de números aleatorios, en lugar de pensar en el complicado cálculo de propagación de errores. Por otra parte ignoran la existencia del ser humano con su conducta no aleatoria y estudian el fenómeno económico como si lo fuera, ignorando la causalidad entre acción de personas y dinero. Es más fácil suponer que las personas no existen.
¿Y cómo hacen que las personas sean tan predecibles? Cuando la gente confía se deja llevar por lo que le digan. Entonces han tratado de empujar al ser humano no aleatorio hacia conductas que fueron propiciadas por la relación de confianza de las personas hacia los bancos y hacia los gobiernos. Y es eso lo que hace predecibles a las personas para ajustar los resultados: la confianza. Esa confianza se vio minada en esta crisis, y eso hace un poco ingobernable hoy a las masas, aunque por su ignorancia aún es parcialmente manipulable. Los que abusaban de las personas abusaron del abuso mismo, y corren el riesgo de perder el control del timón.
No contentos con el fracaso rotundo de los modelos neoclásicos sesgados, ahora los académicos de la religión de pseudociencia financiera quieren revivir los modelos axiomáticos bajo la forma de "econofísica" (Failed Economists Are Now Developing 'Econophysics' As Our New Savior). Los economistas neoclásicos que le enseñaron economía al mundo estaban teniendo pérdidas en sus universidades con la crisis del 2008 (Harvard and Yale Report Losses in Endowments). ¿Por qué los seguimos escuchando?
¿Significa esto que debemos de dejar de creer lo que digan los economistas? No. Recordemos que la economía neoclásica en realidad no es economía, sino simplemente finanzas, "dinerología", estudio del dinero, mientras que la economía es la ciencia social, estudio de las personas y la administración que hacen de los recursos, una ciencia antropocéntrica.
Los economistas son gente respetable y que sabe. Los dinerólogos de las finanzas, que juegan con los números como si fuera Dios jugando a los dados, no son más que superstición numérica, que encuentra las propiedades místicas de los números, igual que la secta de los pitagóricos que inventó la numerología.
Las mentiras estadísticas
Dicen las estadísticas que en EUA hay deflación porque así lo muestra el IPC (U.S. CPI Inflation Turning Negative, Deflation?) pero si le preguntas a la gente en las calles de EUA te dirán que el costo de la vida sube, algo que el inversionista Jim Rogers también nota (Interview With Jim Rogers: The CPI Is A Lie And Inflation Is Going To Increase). ¿A quién le crees?
En un post anterior La confusión entre riqueza y deuda (y las aberraciones conceptuales derivadas) y también en Cuando las malas noticias se disfrazan como buenas noticias analizamos cómo el PIB está compuesto por una extraña mezcla de deuda y riqueza que lleva a conclusiones engañosas.
Y vemos en las noticias que se habla de recuperación de EUA, pero no se entiende si el que se recupera es el gobierno, el ciudadano, las empresas o los bancos, y no se menciona en ninguna parte lo que mencionaba en mi post anterior El horrible dilema: Inflación o desempleo donde se analizaba el asunto de la causalidad, que si se ignora hace inválidas las estadísticas.
Mala interpretación o mal uso de la estadística
Hay ocasiones donde lo que hay no son mentiras intencionales o engaños urdidos por alguien, sino simplemente una estadística que te dice que algo sube y también que baja. Supongamos que tenemos una gráfica y si vez la tendencia de largo plazo hay tendencia bajista pero si acortas el periodo tiene tendencia alcista. Entonces, ¿sube o baja?
Allí tendrías que aplicar técnicas estadísticas y no incurrir en sesgos no estadísticos que te lleven a conclusiones erróneas. Entonces con todos los engaños posibles, y con todos los posibles sesgos que pueden estar agregando un riesgo incuantificable a tu inversión, ¿no sería mejor entender un poco más de estadística? No vaya a ser que pierdas tu inversión por escuchar un consejo o por asumir un supuesto, por pensar que la estadística señalaba algo que en realidad no señalaba o pensar que no indica algo que sí apunta.
¿Cómo sabes si el que estás usando un buen indicador? ¿Cómo sabes si estás usando la interpretación adecuada?
Después de hoy, al leer este post, ya no te tomarás el sesgo tan a la ligera.