Acceder

Un profesor de estadística en la facultad contaba que en 1936, un sondeo realizado para tratar de anticipar quien iba a ganar las elecciones presidenciales en Estados Unidos, mostró que Alf Landon, iba a ganar arrollando las elecciones encabezando el partido republicano. La verdad es que para poner el nombre en este post he tenido que irme a Google y buscar los contrincantes de Franklin D. Rooselvelt, que realmente es el que ha pasado a la historia.

Esta encuesta no estaba manipulada, (¡no tenía sentido ya que al poco tiempo se conocería la realidad!). Simplemente al final se convirtió en el ejemplo perfecto de cómo una incorrecta elección del método de realización de una encuesta, afecta a la selección de la muestra y da resultados completamente equivocados.

La encuesta en cuestión, fue realizada por teléfono, obviando el hecho de que en 1936, la realidad social es que aunque existían teléfonos en muchas viviendas, no era del todo habitual. Por supuesto, los teléfonos estaban en los domicilios de determinado segmento de la población; en particular con aquellas familias que tenían un volumen de renta desahogada, (recordemos que estaban en plena depresión). Por tanto resulta que básicamente, las llamadas se hicieron a republicanos, porque los simpatizantes del partido demócrata no tenían teléfono.

Lo que se dice un fallo garrafal, que por cierto se ha detectado porque al poco tiempo hubo elecciones. Es importante tener en cuenta esto, porque realmente si la encuesta hubiese sido 2 años antes, pues habría quedado como cierta, o jamás se hubiese reconocido el error.

Normalmente se espera que de estas historias se aprende, pero el caso es que hoy en día nos encontramos con que el ICO usa el teléfono para tratar de hacer su encuesta de la confianza del consumidor. Por supuesto, desde 1936, el teléfono se ha generalizado y ha entrado en todas las casas. Sin embargo, convendría tratar de determinar si realmente ha existido algún error, o hay algo que desvirtúa las estadísticas.

La pregunta es sencilla. ¿Haciendo una encuesta por teléfono fijo, encontraremos a jóvenes?, ¿a gente que ha perdido su casa?, ¿a alquilados?. En 1936, era un segmento de población muy definido el que tenía teléfono fijo. Pero hoy dada la aparición de los móviles, ¿podemos pensar que el teléfono fijo representa al total de la población?. Pues es fácil saberlo según los datos del ine.

Encuesta sobre Equipamiento y Uso de Tecnologías de la Información y Comunicación en los hogares 2009

Resultados nacionales. Resumen

Resumen de datos en porcentaje

Viviendas con teléfono fijo

Total Viviendas

80,3

Tamaño del hogar: Hogares de 1 miembro

68,1

Tamaño del hogar: Hogares de 2 miembros

82,1

Tamaño del hogar: Hogares de 3 miembros

80,8

Tamaño del hogar: Hogares de 4 miembros

84,3

Tamaño del hogar: Hogares de 5 ó más miembros

80,6

Hábitat: Más de 100.000 habitantes y capitales de provincia

85,3

Hábitat: De 50.000 a 100.000 habitantes

80,2

Hábitat: De 20.000 a 50.000 habitantes

75

Hábitat: De 10.000 a 20.000 habitantes

76,7

Hábitat: Menos de 10.000 habitantes

76,1

Ingresos mensuales netos del hogar: Menos de 1.100 euros

66,5

Ingresos mensuales netos del hogar: De 1.100 a 1.800 euros

78,5

Ingresos mensuales netos del hogar: De 1.800 a 2.700 euros

86,9

Ingresos mensuales netos del hogar: Más de 2.700 euros

93,4

Ingresos mensuales netos del hogar: NS/NR

86,5

Fuente:Instituto Nacional de Estadística

Copyright INE 2009

Parece ser que la proporción de viviendas con teléfono fijo es mayor en hogares con rentas altas, (entre otros grandes grupos). Por tanto cuando menos, deberíamos tenerlo en cuenta a la hora de hacer estadísticas telefónicas como la de confianza del consumidor del ico. El ico hace mil llamadas, en horario de 17 a 22 horas, evitando caer en fin de semana. ¿A quien llama?. ¿Estará llamando a las personas que peor lo están pasando en esta crisis?.

Errores de este tipo a la hora de diseñar las estadísticas, desde luego comparten mantel con manipulaciones; en este sentido el mismo profesor de estadística que nos enseñaba esta historia, nos dio una práctica magistral sobre técnicas de tratamiento estadístico avanzado. En el examen aprobamos 16, de un total de unos 400 alumnos presentados. Es más que evidente que el número de aprobados no llegaba a los requisitos mínimos que se establecían, y en todo caso la realidad es que un porcentaje tan bajo de aprobados no deja muy bien al profesor. En fin, la sorpresa fue que ante una crítica en la revista de la universidad, el profesor sacó una nota conforme se habían presentado 32 personas, por tanto el porcentaje de aprobados fue el 50%. ¿Qué pasó?. Pues que realmente la mayoría de los alumnos tuvieron un “No Presentado” en la citada asignatura. Lo cual les vino muy bien, ya que no corría convocatoria, (en esa época existía un límite de intentos para aprobar una asignatura que era 6 más la de gracia, que desconozco si existe hoy). Por otra parte no constaba un suspenso en el expediente. El profesor logró maquillar los datos y todos relativamente contentos, (aunque claro los suspensos, pasaron a no presentados, lo cual no les solucionaba definitivamente el tema).

Esto no es error, es manipulación de la estadística, que es lo que podría hacer los bancos si digamos que buscasen formas de reclasificar la mora. En este sentido, las daciones de pago, refinanciaciones a la desesperada, ventas de deuda a fondos buitre y olvidos, afectan al porcentaje. A los que no pueden pagar, también les interesa, pero como a los suspensos del ejemplo anterior, resulta que tampoco se les soluciona de todo el problema. No son morosos, pero tampoco pueden pagar, que es el problema de fondo.

Otros límites a las estadísticas pueden ser las propias limitaciones de los índices. En este sentido ya he hablado aquí de los límites del IPC, pero quería recordar como Roubini nos muestra un fallo de la medida del PIB. La realidad el que el PIB surge aplicando modelos econométricos. Sin embargo los datos para el PIB salen de las cuentas de las grandes empresas de tal forma que en caso de que las grandes empresas se encuentren mejor que las pequeñas, el dato del PIB saldrá mejor que la realidad. Roubini, nos muestra un ejemplo claro de que aunque parezca que nos estamos recuperando la realidad es que esto no es más que un espejismo estadístico fruto de mirar únicamente a las grandes cuentas, en lugar de al conjunto de la sociedad. Desde luego no puedo estar más de acuerdo con el profesor, como ya he puesto en el post en que me preguntaba ¿nos estamos recuperando?.

El caso es que cada vez que nos muestran una estadística, debemos plantearnos si pueden tener algún error en la metodología, (eso que nadie lee), por otra parte debemos considerar si existen intereses o posibilidades de que sea alterada. Y por supuesto, debemos analizar exactamente cuáles son los límites y significados. Recordemos que los datos y las estadísticas son nuestros ojos.

Saludos.

7
¿Te ha gustado mi artículo?
Si quieres saber más y estar al día de mis reflexiones, suscríbete a mi blog y sé el primero en recibir las nuevas publicaciones en tu correo electrónico
  1. Top 100
    #7
    09/12/09 23:08

    El problema es que es un circulo.

    sueldos bajos implican que no hay demanda para productos de valor añadido.

    implica que las empresas seran intensivas en trabajo. lo cual implica baja productividad,

    por otra parte... ¿Que otra opción queda que especulacion?

  2. #6
    Anonimo
    09/12/09 19:30

    Paro y fracaso escolar: la economía ya paga la factura de la Educación
    .....Y se preguntará usted: pero, ¿la causa no puede ser la construcción o la inmigración? El que haya subido más el de hombres, así parece indicarlo. Sin embargo, si se descuentan tales factores, las diferencias se reducen unos pocos puntos, pero siguen siendo muy elevadas. Por ejemplo, eliminando al sector de la construcción, la diferencia de tasa de paro entre los del grupo de abandono temprano y los universitarios se reduce del 17,9% al 16,5 en 2009.
    http://www.magisnet.com/noticia.asp?ref=5097

  3. #5
    Anonimo
    09/12/09 19:05

    Esta claro pero derivaba del modelo de crecimiento basado en salarios bajos, en sectores donde se podia tener salarios bajos, cuanto estos sectores tocan fondo, donde va la gente sin formacion ? Si se hubiesen tenido un crecimiento de todo un poco, no hubiese habido epocas de tanto trabajo pero ahora tampoco habria tanto paro. Es de sentido comun.

  4. Top 100
    #4
    09/12/09 16:02

    Anonimo 14.34....

    verás con el paro hay una cosa que me mosquea a mi, pero mucho.

    La verdad es que la tasa de paro se explica por cuatrocientos mil factores, salvo por uno que es el más evidente.

    la inmigración. No se me entienda mal, no estoy echando la culpa a los inmigrantes, pero desde luego han sido muy convenientes para tener un crecimiento de la poblacion activa, que ha permitido la existencia de un millon de parados en los buenos tiempos, lo cual a su vez implica la contención salarial.

  5. Top 100
    #3
    09/12/09 16:00

    Jorge Luis...

    Sinceramente varianzas o cualquier medida de las distribuciones suena a chiste en este país.

    Es aburridisimo... En este sentido, si ni tan siquiera se habla de la distribucion de la renta, (nos quedamos en la renta per capita),... En fin. Ya ni la mediana, varianzas, ni nada por el estilo.

    En fin.

  6. #2
    Anonimo
    09/12/09 15:34

    Por si no lo conoceis hay web, ensilicio donde nos indica errores de las http://www.ensilicio.com/2008/11/graficas-los-datos-de-paro-en-europa-dejan-en-evidencia-a-zapatero.html
    y el que comentaba hace unos dias
    estadisticashttp://en.wikipedia.org/wiki/Hans_Rosling

  7. #1
    Anonimo
    09/12/09 14:36

    Diga usted que sí, así es. Y, bajo ciertas condiciones, no es muy difícl tenerlo en cuenta, compensar los estimadores, e incluso dar alguna estimación de la varianza...
    En cualquier caso, lo peor es que en un mundo inundado de estadísticas y números, todo el mundo se fija en los números, pero nadie se preocupa de la metodología seguida. Se habla de la "cocina de los datos", y nadie parece preocuparse. Eso sí, luego se dice que hay Verdades, Mentiras y Estadísticas.
    Lo peor no es que siempre hay alguien interesado es esa manipulación, por más alerta que estés, siempre hay algún detalle... Lo más grave es que ni hay cultura estadística, ni parece que hay interés en que la haya.


Definiciones de interés
Sitios que sigo