En muchas ocasiones en este blog he recurrido a datos del INE; en no pocas he expuesto o criticado determinadas metodologías a la hora de crear las estadísticas. Sin embargo hasta ahora siempre he creído que las estadísticas no estaban manipuladas.
Pero he tenido conocimiento de que el INE ha tomado una serie de medidas en el proceso de toma y tratamiento de los datos que suponen una clara manipulación de una de las encuestas más importantes que tenemos en España: La Encuesta de población Activa.
Quienes conozcan este blog saben, que para bien o para mal trato siempre de aportar conclusiones en base a argumentos que a su vez vienen siempre de datos que se pueden contrastar. Pero hoy me toca exponer una información que me ha llegado y que me parece especialmente relevante y grave. Está fundada en fuentes que no puedo identificar a las que les doy la máxima credibilidad. Hasta donde he podido he buscado información que lo corrobore y además el proceso es coherente con los resultados que hemos encontrado en la encuesta.
La información se refiere a que el INE ha priorizado las llamadas a hogares que sabían ocupados (explico después como se segmentan) y ha dejado para el final las llamadas a hogares de pensionistas. Todo ello, entremezclado con la introducción de personal para realizar trabajos de una empresa pública pero que contrata a trabajadores sin los requisitos del sector público y que en todo caso no son personal permanente sujeto a independencia, lo que es lo mínimo que se debe exigir a los trabajadores que desarrollan esta función.
Para centrar el tema me gustaría recordar un símil habitual en el campo de las encuestas; la cocina. En la cocina de las estadísticas se usan unos ingredientes (datos recogidos aleatoriamente) para de acuerdo a unas recetas determinadas (procesos), que nos pueden gustar o no, llegar a un resultado. Y esto es un aspecto clave; se puede criticar la habilidad del cocinero o las recetas; pero hay un punto que todos deberíamos tener claro: ¡no puede existir manipulación en la obtención de datos!; y esto precisamente es lo que me ocupa en este post.
El organismo encargado de recopilar, tratar y ofrecer información estadística es el Instituto Nacional de Estadística. Por tanto, del rigor y calidad del trabajo de este organismo depende el rigor y la calidad de toda la información a nivel macro que exista.
De esto depende la confianza en las instituciones y finalmente es un aspecto clave para determinar si estamos en un país con unos estándares aceptables o nos encontramos en una “Monarquía Bananera”. Es tan simple como decir que cuando no podamos creernos los métodos y resultados de las encuestas públicas ya no tendremos ojos.
En primer lugar me gustaría destacar que las encuestas son el único medio para mostrar una realidad que no podríamos conocer de otra forma. He tratado de justificar, en muchas ocasiones, que la interpretación de las encuestas difiere de la realidad. Pero de la misma forma he defendido reiteradamente que estas malinterpretaciones responden a procesos que no son manipulación. Es muy diferente criticar que los resultados se presenten de una forma conveniente a unos intereses que criticar que se ha hecho trampa en la confección de datos oficiales. En particular, entiendo que no son manipulaciones (aunque sí estén sujetos a crítica) ni los errores, ni los cambios metodológicos ni mucho menos que los analistas no comprendan bien los términos estadísticos que usan.
En ocasiones encontramos errores; (me gustaría recordar el caso de las encuestas sobre las elecciones en 1936 en USA que pronosticaban una victoria del candidato republicano por el sencillo motivo de que se hicieron por teléfono en un momento en el que la mayoría de los que tenían teléfono eran los votantes republicanos). Los errores en el diseño son inherentes a las estadísticas y por tanto no los censuro. Además, conociendo los datos del diseño, cualquier persona puede detectar los errores y sesgos que puedan existir y por tanto interpretar correctamente.
Otras veces encontramos cambios metodológicos que hacen que estemos comparando cosas distintas. El PIB de 2014 no recoge lo mismo que el PIB de 2002, por lo que poner una gráfica de evolución del PIB que incluya los dos años es un error garrafal, y esto tampoco es manipulación. Conociendo la metodología, este error será culpa del que coja los datos “a lo bruto”.
Otra gran fuente de error está en que las cosas no son lo que creemos que son. Por ejemplo me gustaría recordar, a título de ejemplo, que en el PIB aparecen rentas y consumos que son en realidad imputaciones y no estrictamente renta y consumo (propongo como ejemplo el caso de las “actividades inmobiliarias en el PIB”). Cómo también he explicado, si no tenemos en cuenta esto podemos tener conclusiones erróneas acerca de los datos que se analizan. Esto tampoco lo considero manipulación del INE siempre que tengamos información suficiente para descubrir (con mayor o menor dificultad) lo que en realidad nos dicen los datos.
Aclarado todo esto, paso a explicar lo que sí considero especialmente grave. En principio, la única información publicada se corresponde a una denuncia de un representante de la CIG (sindicato gallego) en la web Praza Pública, en la que se pregunta las razones por las que el INE, por primera vez en la historia, “privatiza” los trabajos de la EPA. La entrada en cuestión es incompleta y además estimo que tiene un grave error ya que en realidad los trabajos de la EPA no se están privatizando. Sin embargo el artículo corrobora la información que me habían facilitado en muchas cosas, aunque parece que se queda un poco corto. No afirma la existencia de manipulación pero se pregunta las razones de un proceso que en realidad es de externalización.
A título de antecedente me gustaría explicar que el INE usó durante mucho tiempo contratos temporales de obra o servicio determinado con distintos trabajadores para los trabajos de encuestas periódicas. Se entendía por tanto que el organismo contrataba en fraude de ley porque se trataban de encuestas perfectamente programadas. Judicializado el tema, han recaído sentencias obligando al INE a recontratar a estas personas, que pasarían a ser personal propio, para dichas encuestas.
Sin embargo el INE decide externalizar los servicios; lo que el artículo dice incorrectamente: privatizar. A tal efecto aparece una empresa pública que se llama Tragsa, que a través de su filial Tragsatec se ha ocupado de contactar con casi 500 hogares para la confección de los trabajos de la EPA durante los últimos meses de 2014. Esta información sale de una nota de prensa de 26 de enero de 2015, remitida en el contexto del ruido generado por los sindicatos (contexto en el que también debemos entender la entrada de antes).
Tragsa es una empresa pública, por lo que no deberíamos hablar en ningún caso de privatización. Sin embargo, los criterios de contratación y el personal no responden a los criterios de la administración pública; no hay más que ver el apartado de “trabaja con nosotros” en su web:
El problema es que no había nada que indicaba que el grupo Tragsa trabajaba en la EPA salvo en el apartado de observaciones del sistema informático del INE donde aparecen las marcas de los trabajadores de esta empresa. Entiendo que por esta razón surge la nota de empresa (unos días después de la entrada del post de sindicato) para darle cierta “oficialidad” a la colaboración.
En primer lugar no existe ninguna garantía de que los datos que ofrece Tragsa, tomados por personas que son contratadas “por perfil” respondan al interés general. Es sencillo entender que el contratado hará lo que sus jefes quieran y sus jefes son los que los contratan; no los ciudadanos.
Pero es que además en el apartado de metodología de la EPA encontramos lo siguiente: “Hay 52 oficinas provinciales en toda España que cuentan con personal permanente que hacen el trabajo de ese territorio en relación con las entrevistas personales. También hay siete centros de entrevista telefónica asistidos por ordenador que cubren toda la muestra en sucesivas entrevistas. Cada semana, se envía la información disponible en cada oficina provincial o centro de entrevista telefónica a la oficina central en Madrid. En la Comunidad Autónoma de Galicia, el trabajo de campo se comparte con el Instituto Gallego de Estadística (IGE).”
Nótese que las prevenciones sobre la recogida de los datos no son ciertas, ya que existen numerosas sentencias que afirman que se estaba realizando la encuesta con personal no permanente (y por tanto más dúctil) y tampoco aparece por ningún lado Tragsatec ni empresa ajena alguna.
Con todo tal circunstancia no es tan grave en comparación con lo siguiente; Para que se entienda debemos tener en cuenta el diseño de la recogida de datos.
Para obtener los datos se seleccionan 65.000 familias en cada trimestre de tal forma que cumplan determinados criterios de representatividad. Cada trimestre salen de la muestra 1/6 de los hogares. De esta forma, cada familia es entrevistada durante 6 trimestres consecutivos, como máximo. El diseño de la muestra está centralizado y en las delegaciones del INE se encargan de realizar la encuesta a las personas (en este caso familias) que salen en la base de datos.
La primera entrevista a cada familia es presencial mediante el desplazamiento de personal del INE; una vez obtenidos los datos de las familias las siguientes entrevistas son telefónicas. (dicha información también aparece corroborada en la página de la metodología del INE anteriormente linkada)
Se ha jugado con dos aspectos muy preocupantes relacionadas con el contacto telefónico. Recordemos que están llamando a hogares sobre los que ya existen datos (otro de los problemas de Tragsatec es que han accedido a estos datos) y por tanto la posibilidad de segmentación. Las llamadas telefónicas tienen el problema de la localización ya que las personas no están siempre localizables y en casa. Tenemos que tener en cuenta que lo normal será tener que llamar varias veces a muchos hogares para localizarlos y aquí surgen dos comportamientos que son una clara manipulación de la muestra:
Me cuentan primero que las bases de datos de las que las personas llamaban se abrieron en dos fases. En una primera fase se eliminaron de la base de datos aquellos hogares de pensionistas. (Recordemos que los datos se obtienen ya en la primera encuesta). A estos hogares se les ha llamado a todos en los últimos dos días de confección de datos. Me indican que la explicación que se ha dado a esta novedad está en los recortes de personal. Dado que es más difícil localizar a las personas que están trabajando se concentran las llamadas primero en los trabajadores para conseguir la mayor parte de respuestas. Queda al arbitrio de todo el mundo entender si esta explicación es coherente o no; pero que no quepa ninguna duda que no se puede hacer una encuesta para determinar la situación laboral de la sociedad concentrándose primero en los trabajadores.
Llegado un punto determinado se abren las llamadas al resto de personas para cubrir el cupo. Debemos tener en cuenta que en un hogar en el que no se conteste no entra en los resultados, y derivado de concentrar los esfuerzos en localizar a los ocupados, apenas ha existido tiempo para localizar a los inactivos.
Es decir, estamos ante un proceso similar a “cargar los dados”, se concentra la búsqueda de respuestas que contesten que están empleados y se reducen los esfuerzos y las posibilidades de contactar con inactivos. Es decir, se mejora artificialmente el dato de empleo y de actividad.
Me cuentan, en segundo lugar, que también en la última EPA las frecuencias de las llamadas no fueron las mismas. Es decir, se han concentrado los esfuerzos en aquellas familias que, a la luz de la información previa, estarían trabajando. Si a una familia se las llama en 30 ocasiones (hasta que se le localice) y a otras familias en 2 ocasiones (y a pasar a la siguiente) es mucho más sencillo localizar a las primeras, de tal forma que las respuestas que vamos a obtener son las que queremos.
Lamentablemente la EPA no da información sobre el número de respuestas obtenidas y en todo momento se refiere a la muestra de “aproximadamente” 65.000 hogares. Los índices de calidad de las respuestas, se efectúan sobre las respuestas recibidas. Es obvio que dichos índices por tanto no van a detectar irregularidades en la selección de las llamadas.
En definitiva, parece claro que el INE ha cargado los dados en este casino con el objetivo de alterar los resultados de la EPA lo que me parece especialmente grave. No puedo valorar cual de las dos opciones es peor:
- O bien resulta que alguien del gobierno pretende acabar con el paro preguntando si trabajan a los trabajadores para transmitir una imagen infiel aprovechando las instituciones públicas que previamente han desguazado.
- O bien resulta que después de desguazar las instituciones públicas y no tener personal adecuado para una función tan importante, deciden concentrar los esfuerzos en un segmento de una muestra determinado lo que va en contra de toda lógica estadística e incluso de sentido común.
En cualquiera de las opciones me parece que lo único que nos diferencia de una republica bananera es que tenemos dos reyes.